Unboundedly

日々大学院で学んだこと、考えたことを更新

「交互作用」とはなにか:介入効果が一様でないときの統計手法~その目的と分類、解釈~

今回は「交互作用(interaction)」と呼ばれる概念について書いていきます。端的に言えば、”人によって効果が違う”という現象を見る統計学の考え方だと思います。例えば「薬Aが病気Dのリスクを10パーセント下げる」といったとき、実はその薬は女性では効果がめちゃくちゃあるが男性にはほとんど効かない、なんてことがあるかもしれません。交互作用の考え方を使えば、このように介入の効果が一様でない現象の存在を調べることができます。
交互作用は統計を使う学問で広く使われているのですが、割とルーズに使われていることが多い印象が個人的にあります。交互作用のなかにもいくつか異なるタイプがあり、その種類によって解釈が変わってきます。また、そもそも交互作用を見る目的によって、必要となる統計モデルの作り方も異なってきます。このように「交互作用」を扱ううえで注意すべきポイントについて、一般的な統計学の教科書に載っているイントロから少しだけ踏み込んだ内容までまとめていきます。

  • 交互作用の定義・統計モデルでの扱い方
    • 交互作用を想定しない場合
    • 交互作用を想定した場合
  • そもそもなぜ交互作用を見るのか?その目的は?
    • 1.限られた資源で介入すべきサブグループを同定したい
    • 2.介入が悪影響を及ぼす集団を同定したい
    • 3.介入・曝露因子の効果のメカニズムを知りたい
    • 4.そもそも効果の違いに興味がある
    • 5.曝露因子以外に介入する対象を見つける
  •  交互作用の分類
    • 足し算交互作用と掛け算交互作用
      • 数式を使った定義
      •  足し算と掛け算、どちらを見るべきか?
    • 因果交互作用と効果修飾
  • 参考文献

続きを読む

観察データを用いた因果推論で生じるバイアスの程度を考える:感度分析(Sensitivity analysis)入門

さて、今回からイデオロギー色の少ないブログ活動に戻ります。前回の受動喫煙に関する記事の中で、「感度分析("Sensitivity Analysis")」というテクニックを紹介しました。

どうも私の言葉足らずか、このテクニックに関して多くの方に誤解と混乱を招いたようなので今回改めて整理してみたいと思います。

  • なぜ感度分析が有効なのか?その意義は?
  • 交絡バイアスの向き
  • 交絡バイアスの大きさ
    • ”Without Assumptions”とは
    • 古典的Cornfieldの条件
    • 仮想の交絡因子によるバイアス:Bounding factorをもとめる
    • どんな交絡因子ならば観測された関連を説明できるか
  • RによるBounding factor、E-valueの可視化
続きを読む

受動喫煙防止法について論点整理②:サイエンス × 価値観 ≒ 政治でつくるザッカーバーグ的理想世界

なんだか壮大なタイトルになりました(笑)

前回は「受動喫煙による健康影響・死亡数」なるものがどうやって計算されていてるか、どの程度信用できる数字なのかについて整理しました。この辺りは、私の専門性が少しだけ活きてくる部分であり、(少なくとも私が定義する範囲で)”科学的”な議論であったと思います。

今回は「じゃあ受動喫煙が健康に対して多かれ少なかれ影響があるとして、多くの人の”自由”を犠牲にコストをかけて対策するほどのことなのか」「受動喫煙対策をするとして、室内全面禁煙が本当に妥当なのか。やりすぎではないか」といった部分について私の個人的な意見を述べたいと思います。なぜ個人的な意見と強調したかというと、後でも述べますがこれらのトピックは科学”だけ”でものを言うのが難しい領域であり、必ず一定程度の主観的な価値判断が入ると私は考えていますので、そのように読んでいただけると幸いです。すなわち、こいつは科学者の端くれのくせに政治的なことを言って偏っている!という批判はまったく論外ということです。みんな偏っているのですから。

  • 前回記事のまとめ
  • 受動喫煙の健康影響があったとして、政策は正当化されるか? 
    • 受動喫煙対策をどう考えるか
    • 健康政策を支持する”極端”な価値観
    • 科学的根拠に基づく政策決定はバリューとサイエンスのバランス 
    • では、社会として何を目指すか?
  • 解決策として飲食店内全面禁煙が妥当なのか?
  • 価値とサイエンスが交わる領域で科学者はどうふるまう?

f:id:KRSK_phs:20170529091807p:plain

続きを読む

受動喫煙防止法について論点整理①:受動喫煙による健康リスク・死亡者数の推定はどのくらい信用できるか?

受動喫煙の防止策として、室内全面禁煙を目指す厚労省側とそれに反発する自民たばこ議連が争っています。本件に関しTwitter上でも、なかなか面白いディスカッションがおきています。

室内禁煙による受動喫煙対策は「科学的根拠(エビデンス)」に基づくものであり、国際的なスタンダードとなっているため実施すべきであるとする(私自身を含めた)公衆衛生・医療関係者らの主張に対して、経済学者・統計学者の方々から辛辣なご批判が届いています。

指摘されている内容を読んでみると、たしかに言っていることに一理ある。というか指摘はおおむね”正しい”のです。やはり経済学者はデータ分析に厳しい。とても素晴らしいことだと思いますし、私も彼らを尊敬し、そのようになりたいと日々思って勉強しています。しかし今回の件に関する批判はごもっともとして、あたかも「室内禁煙は支持するデータは全くのデタラメで信用ならん。やはり禁煙なんてすべきでない」とするのは早計だと思うのです(彼らがそう考えていると言っているのではありません。研究者からの「それらしい」批判を読んだ一般の方々に誤解してほしくないと私が思っているだけです)。

室内禁煙を支持する人間の一人として、そして批判にさらされている「疫学研究」に関わる人間の一人として私の個人的な考えを述べつつ、議論を整理できればと思い下手な文章を久しぶりに書いてみた次第です。なお繰り返しですが、批判をしてくださった特定の個人に対して彼らが間違っているとかジャッジするつもりはないし、むしろとても誠実でまじめな科学者なのだと尊敬していることをご理解ください。

まずは論点の整理から。室内禁煙の是非をめぐる議論には三段階の合意(下記1-3)と別の争点(下記4)があります。

1. そもそも受働喫煙は健康に対して悪影響があるのか?
2. 大なり小なり健康影響があるとして、わざわざ法改正してまで対策をすべきか?
3. 受動喫煙対策をするとして、屋内全禁煙が妥当なのか?厳しすぎないか?
4. 科学者という立場で喫煙の健康リスクなど、具体的な数字を一般に伝えるときのサイエンス・コミュニケーションに関する指摘

本記事ではそれぞれ順に触れたいと思います。長くなりすぎたので、今回は1についてのみ書きます。残りは明日以降。

  •  統計で受動喫煙の健康リスクってどうやって出すの?統計における「因果」とは?
    •  「因果関係」なるものをどう定義しているのか
    • どうやってデータから"因果関係”っぽいもの”を導くか
  • 疫学研究の結果をどう解釈するべきか?
    • 1.バイアスなんてものは必ず存在するし、厳密な因果関係なんて一生分からない
    • 2.あくまで「集団レベル」の話をしている
  • 科学的根拠(エビデンス)に基づく政策とは?
  • 「受動喫煙による死亡は年間15000人」はけしからんのか?
    • 前提となる数字が怪しい?
    • 感度分析によって考えるバイアスの”程度”

f:id:KRSK_phs:20170528172341p:plain

続きを読む

【点と矢印で因果関係を考える】データからニセモノの関連が生じるパターンとその対策まとめ:因果ダイアグラム(DAG)によるバイアスの視覚的整理

DAGシリーズの(とりあえず)最終回です。よく「因果関係と相関関係は違う」*1といいますが、具体的にどのような場合に両者が一致しない(バイアスが生じる)のかをDAGをつかって整理します(簡単にそれぞれのバイアスへの対応策にも言及しますが、各手法の詳細は別の機会に譲ります)。

シリーズ第一回第二回では、DAGを使う意義やその書き方・読み方のルールについて書いてきましたが、実はこれらはすべて今回の第三回につなげるための伏線でした。本記事はDAGに関する基礎知識を前提として書き進めていくので、不安な方は過去記事を参照してみてください。基本的な内容ではありますが、介入効果の評価などデータを扱って因果関係を考えていくうえで避けては通れない非常に重要な内容だと思うので、気合いをいれてまとめてみます。

f:id:KRSK_phs:20170319221319j:plain

*1:なお、以降では意図的に「相関関係(Correlation)」ではなく「関連(Association)」という表現にしています。

続きを読む

"矢印"をつかって因果関係を視覚的に整理する:因果ダイアグラム(DAG)入門②〜読み方・書き方の基本ルール〜

前回は因果ダイアグラム(DAG)という概念の導入として、そもそもなぜDAGが必要とされるのかについて書いてみました。

今回はDAGシリーズ第二弾として、実際にDAGを”書いて”いくうえでの基本ルールとDAGの”読み方”について整理してみようと思います。DAGの読み書きができるようになれば、様々な要因が複雑に絡み合っているような場合でもAssociationと因果関係を切り分け、どのようなバイアスがなぜ起きているのかを特定できるようになります。

続きを読む

"矢印"をつかって因果関係を視覚的に整理する:因果ダイアグラム(DAG)入門①〜なぜDAGが必要なのか〜

f:id:KRSK_phs:20170120055557j:plain

今回はDirected Acyclic Graph(DAG)と呼ばれるものについて書いてみようと思います。「ダグ」と読みます。日本語では「非巡回有向グラフ」とかいうなんだか難しそうな名前で呼ばれているようです。DAGが何かを一言で説明するとすれば「いろいろな要因を矢印で結んで、それらの間の因果関係について整理するためのツール」といったところでしょうか。本シリーズは以下の三つのテーマに分けて書いていきます。

1.そもそもなぜDAGが必要なのか(本記事)

2.DAGの基本的なルール・書き方と読み方

3.DAGによる様々なバイアスの視覚的な整理

それでは今回はDAGが必要とされる理由について整理してみます。

続きを読む