Unboundedly

日々大学院で学んだこと、考えたことを更新

はじめに

自己紹介

はじめまして。現在博士号取得を目指して大学院に在籍している研究者見習いです。東京で修士号を取得したのちに、2016年夏よりアメリカはボストンのとある大学院のPh.Dプログラムに入学しました。

Public Health(公衆衛生)であるとかEpidemiology(疫学)と呼ばれる分野で研究をしています。多くの人にとって、「なんだそれ??」と思われる分野でしょう。平たくいうと、「どんな人たちが健康でどんな人たちが不健康なのか」「なぜそれらの人々は健康(不健康)なのか、どうすれば人々の健康を向上させることができるのか」という疑問に対して応えるべく研究を行っています。具体的には様々な(主に観察)データを統計解析することで、上記の問題に取り組んでいます。 

研究者としてはまだまだ未熟なのですが、データをいじってみたり、コードを書いたり、文章を推敲したりが根っから好きだったりするので、楽しんで研究修行の日々を過ごしております。SAS, STATA, R, Pythonと一通り使ってきましたが、一応メインの統計ソフトはR(ということにしている)。

ブログを書こうと思った経緯

1.統計学は確かに「最強」かもしれないけど、、、

 一応まじめなというか、それっぽい理由をあげるとすればこれになります。昨今の統計学ブーム、ビッグデータブーム、これ自体は素晴らしいと思うのです。医療や、教育、企業の経営戦略から、国の政策まで、データを活用してあらゆることを可視化し、定量的に評価することで、これまでの経験則に基づく(多くの場合非効率的または意味がない)風習や意思決定のプロセスにメスをいれることができます。わくわくしますね。

でも盲目的にデータを過信するのも危険だと考えています。データは(意図的にであれ、知らず知らずのうちにであれ)うそをつきます。そして、誤った(時に悪意ある)データの活用・解釈は百害あって一利なしです。エセ科学は駆逐しましょうー。データや統計は、それらからなにが言えてなにが言えないのか、各手法ではなにができてなにがいえないのが、それぞれを使用する際の前提条件はなにかを理解したうえで利用するのが健全な使い方だと思います。

ブームがブームのままで終わらず、”正しく”データを使い・解釈していくことで世の中がもっとよくなってほしい、なんてことを考えながらまだまだ勉強中の身ではありますが日々大学院で学んでいることやそこから考えたことを発信していきます。

 2. 学んだことを整理し、理解を深める

実はこちらも大きなモチベーションとなっています。アメリカの大学院教育は大変な詰め込み型なので日々のインプットの量が膨大です。正直消化不良気味になることもしばしば。学んだことをできるだけ分かりやすく、人に伝わる言葉でアウトプットすることでカオスになっている頭の中を整理し、系統的な知識にすることも目的です。

ブログを書くことで新たに学ぶことや理解が深まることも多いはず。自分のもし自分の理解が間違っていたり重要なポイントを見落としていた場合は、インターネット上の素晴らしく優秀な方々がきっと指摘してくれるだろうと期待しています(笑)

3. 少し専門的なことを幅広い人にわかりやすく伝える練習

普段は論文(つまり専門家に向けた”お堅い”文章)を書くことが多いのですが、そんなことばかりしていると、他分野の研究者や一般に向けたコミュニケーションができなくなってしまいそうな気がしてしまいます。私の専門領域では特にそうなのですが、やはり研究から得られた知見や専門性は広く発信しなければなかなか世の中のためになりません。また他分野とのコラボが非常に重要な学術領域でもありますので、そういう意味でも自分の専門分野の知識を、わかりやすく平易な言葉で伝える練習をしていきたいと思います。

将来の就職先はまだまだ未定ですが、なんとなく大学で教えたりする機会もあるのではと思っていたりするので、そこに向けて今から「伝える」トレーニングですね。専門用語をならべて、黒板に向かってしゃべっているような典型的な大学の先生にはなりたくないです。。。

本ブログについて

統計学・データ分析に関する記事がメインです(たぶん)

私の学術的ベースは疫学や生物統計学にあります。したがって使用する用語もこれらの分野で使われているものが多くなりますのであしからず。それって別分野だとこういう風に整理されているよ、こんな用語が使われているよ、みたいなコメント大歓迎です。

さらに、データ分析といってもいろいろなものがありますが、私が主に書く(というか書ける)のは基本的に「因果推論」とか「効果推定」みたいな目的で行う分析の話でして、予測モデルの話(特に機械学習やその界隈の話)などにはあまり触れることがないかもしれません。とはいえ、ビッグデータ分析の講義なども受講予定なのでこの辺りもいずれは。

ただし注意していただきたいのは、私は統計家ではないということです。あくまで統計”ユーザー”の立場から、わかりやすくまとめを目指して更新していきたいと思います。餅は餅屋。細かい数理的なバックグラウンドなどは身の回りの統計専門家に聞くことをお勧めします。

時々、大学院生活や留学に関する記事も書いていく予定です。このあたり、自分が出願準備をしている際に欲しい情報がなかなか見つからず苦労した経験があるので、今後留学を考えている方々に役立つような情報をシェアできればと思っています。

言葉について(すごく私見)

私が米国で学んでいることもあり、ブログの随所に(特に専門用語は)英語が登場することが予測されます。できるだけ対応する日本語も書くつもりですが、いかんせん日本語の専門用語に関しては正しく使えているという保証はできません。ルー大柴かよ、とか突っ込まずに暖かい目で見守ってください。

とはいえ、実はあえて意図的に英語を散りばめていこうと思っています。個人的にはサイエンスは必ず英語で学ばれるべきと思っているからです。だって研究者ってインプットもアウトプットも英語じゃないですか。統計で困ったことがあったとき、新しい手法について学びたいとき、大体一次情報って英語じゃないですか。そもそも単純にネット検索しただけでも英語と日本語じゃ情報量がまったく違いますのでね。。。

 フィードバックをください(切実)

あまり文章を書くのが早いタイプではないので、毎日更新なんてのはできないと思われます。でも頑張ってわかりやすさ目指して記事を書いていきます。ぜひ問い合わせフォームからブログに関するフィードバックをください。

  • 記事のこの部分がよくわからない
  • ~について説明を追加してほしい
  • これ違うやろ!これ抜けてんで!
  • その他、統計一般に関してこれがわからない、こんな記事を書いてほしい

などどしどし送ってください。自分一人で分かりやすい文章書いた気になってドヤ顔せず、真にわかりやすく多くの人の役に立つ情報が発信できるよう、皆様からのフィードバックを心よりお待ちしております。