読者です 読者をやめる 読者になる 読者になる

Unboundedly

日々大学院で学んだこと、考えたことを更新

【点と矢印で因果関係を考える】データからニセモノの関連が生じるパターンとその対策まとめ:因果ダイアグラム(DAG)によるバイアスの視覚的整理

DAGシリーズの(とりあえず)最終回です。よく「因果関係と相関関係は違う」*1といいますが、具体的にどのような場合に両者が一致しない(バイアスが生じる)のかをDAGをつかって整理します(簡単にそれぞれのバイアスへの対応策にも言及しますが、各手法の詳細は別の機会に譲ります)。

シリーズ第一回第二回では、DAGを使う意義やその書き方・読み方のルールについて書いてきましたが、実はこれらはすべて今回の第三回につなげるための伏線でした。本記事はDAGに関する基礎知識を前提として書き進めていくので、不安な方は過去記事を参照してみてください。基本的な内容ではありますが、介入効果の評価などデータを扱って因果関係を考えていくうえで避けては通れない非常に重要な内容だと思うので、気合いをいれてまとめてみます。

f:id:KRSK_phs:20170319221319j:plain

*1:なお、以降では意図的に「相関関係(Correlation)」ではなく「関連(Association)」という表現にしています。

続きを読む

"矢印"をつかって因果関係を視覚的に整理する:因果ダイアグラム(DAG)入門②〜読み方・書き方の基本ルール〜

前回は因果ダイアグラム(DAG)という概念の導入として、そもそもなぜDAGが必要とされるのかについて書いてみました。

今回はDAGシリーズ第二弾として、実際にDAGを”書いて”いくうえでの基本ルールとDAGの”読み方”について整理してみようと思います。DAGの読み書きができるようになれば、様々な要因が複雑に絡み合っているような場合でもAssociationと因果関係を切り分け、どのようなバイアスがなぜ起きているのかを特定できるようになります。

続きを読む

"矢印"をつかって因果関係を視覚的に整理する:因果ダイアグラム(DAG)入門①〜なぜDAGが必要なのか〜

f:id:KRSK_phs:20170120055557j:plain

今回はDirected Acyclic Graph(DAG)と呼ばれるものについて書いてみようと思います。「ダグ」と読みます。日本語では「非巡回有向グラフ」とかいうなんだか難しそうな名前で呼ばれているようです。DAGが何かを一言で説明するとすれば「いろいろな要因を矢印で結んで、それらの間の因果関係について整理するためのツール」といったところでしょうか。本シリーズは以下の三つのテーマに分けて書いていきます。

1.そもそもなぜDAGが必要なのか(本記事)

2.DAGの基本的なルール・書き方と読み方

3.DAGによる様々なバイアスの視覚的な整理

それでは今回はDAGが必要とされる理由について整理してみます。

続きを読む

はじめに

自己紹介

はじめまして。現在博士号取得を目指して大学院に在籍している研究者見習いです。東京で修士号を取得したのちに、2016年夏よりアメリカはボストンのとある大学院のPh.Dプログラムに入学しました。

Public Health(公衆衛生)であるとかEpidemiology(疫学)と呼ばれる分野で研究をしています。多くの人にとって、「なんだそれ??」と思われる分野でしょう。平たくいうと、「どんな人たちが健康でどんな人たちが不健康なのか」「なぜそれらの人々は健康(不健康)なのか、どうすれば人々の健康を向上させることができるのか」という疑問に対して応えるべく研究を行っています。具体的には様々な(主に観察)データを統計解析することで、上記の問題に取り組んでいます。 

研究者としてはまだまだ未熟なのですが、データをいじってみたり、コードを書いたり、文章を推敲したりが根っから好きだったりするので、楽しんで研究修行の日々を過ごしております。SAS, STATA, R, Pythonと一通り使ってきましたが、一応メインの統計ソフトはR(ということにしている)。

ブログを書こうと思った経緯

1.統計学は確かに「最強」かもしれないけど、、、
続きを読む