Unboundedly

統計的因果推論・疫学についてのお話

DAG

回帰分析における「調整変数」の選び方:実践編

回帰分析を用いて「●●の効果を推定する」ことに取り組んだことがある人は多いのでは無いかと思います。 回帰モデルには「調整変数」として、年齢・性別・教育歴・(医学研究の場合は)既往歴などなど様々な要因を投入して、その影響を"補正"しますよね。 今…

「世界一高いIQ」が生んだ謎、モンティホール問題はなぜパラドックスなのか

今回は、前回紹介したシンプソンのパラドックスと同じくらい有名な統計トリック、モンティホール問題について書きます。確率的に正しいことと、我々人間の直感が大きく食い違うシチュエーションの非常に良い例だと思います。 モンティホール問題についての解…

データ分析の不思議、シンプソンのパラドックスを統計的因果推論から考える

今回は統計学で有名な「シンプソンのパラドックス」という問題について紹介したいと思います。簡単にいえば、同じデータでも分析の仕方によって全く矛盾したように見える結果が得られるというお話です。データだけ見ると、信じがたいような直感に反する現象…

統計的因果推論のためのPythonライブラリDoWhyについて解説:なにができて、なにに注意すべきか

機械学習など主に予測を目的とした統計手法に強いイメージのPythonでしたが、統計的因果推論を行うためのライブラリ、“DoWhy”がついにリリースされました。 DoWhy | Making causal inference easy — DoWhy | Making Causal Inference Easy documentation こ…

【点と矢印で因果関係を考える】因果関係がないときにデータから関連が生じるパターンとその対策まとめ:因果ダイアグラム(DAG)によるバイアスの視覚的整理

よく「因果関係と相関関係は違う」といいますが、具体的にどのような場合に両者が一致しない(バイアスが生じる)のかをDAGをつかって整理します(簡単にそれぞれのバイアスへの対応策にも言及しますが、各手法の詳細は別の機会に譲ります)。

"矢印"をつかって因果関係を視覚的に整理する:因果ダイアグラム(DAG)入門②〜読み方・書き方の基本ルール〜

前回は因果ダイアグラム(DAG)という概念の導入として、そもそもなぜDAGが必要とされるのかについて書いてみました。 今回はDAGシリーズ第二弾として、実際にDAGを”書いて”いくうえでの基本ルールとDAGの”読み方”について整理してみようと思います。DAGの読…

"矢印"をつかって因果関係を視覚的に整理する:因果ダイアグラム(DAG)入門①〜なぜDAGが必要なのか〜

今回はDirected Acyclic Graph(DAG)と呼ばれるものについて書いてみようと思います。「ダグ」と読みます。日本語では「非巡回有向グラフ」とかいうなんだか難しそうな名前で呼ばれているようです。DAGが何かを一言で説明するとすれば「いろいろな要因を矢印…