化学同人竹内様より献本御礼。
こんな本を待っていた。
統計思考が重要なことは不透明な時代を見抜く「統計思考力」」を読めばいやでもわかるし、「統計数字を疑う」をよめば統計をそのまま信じようとはしなくなる。
しかしそれでは一体全体統計というものをどう扱えばいいのか。
本書には、それがある。
本書「統計数字を読み解くセンス」は、疫学という、統計を最も実践的に扱う学問の専門家が、統計のどこに目をつけ、どこに注意するのかを実際に統計を処理しながら学んでいく一冊。
目次 - KAGAKUDOJIN BOOKSHELLより
|
|
目次を見ての通り、本書に出てくるのは身近で、それだけにだまされやすく、そして実際多くの人がだまされている問題ばかりである。そう。多くの人。その中には、プロすら含まれる。
P. 148一九三六年の米国大統領の選挙において民主党のフランクリン・ルーズベルトと共和党のアルフレッド・ランドンのいずれが大統領になるかについて、リテラリー・ダイジェスト社は二五〇万人規模の世論調査を行い、ランドンが当選するだろうと予測しました。一方、ギャラップ社はわずか二〇〇〇人の調査から、ルーズベルトが再選されるという結果を出しました。選挙の結果はルーズベルトの再選でした。
統計学にとってのこの事件は、建築学にとってのタコマ・ナローズ・ブリッジに相当するほど有名なものなのだが、この事件を知らなかった人、理由はおわかりになるだろうか。
リテラリー・ダイジェスト社が使った方法は、電話。
え?まだわからない?
実は、当時はまだ電話というのは高級品で、電話という手法を取るだけで標本が富裕層側に傾いてしまったのだ。その結果の共和党優位。一方ギャラップの二千人は、本当にランダムに算出した二千人。二千が二百五十万に「勝った」理由が、ここにある。
このエピソード、現代においてはなおのこと意味がある。ネット調査というのは、現代においては当時の電話調査と同じバイアスがかかりはしないか。
しかしこのバイアスこそ、統計思考の最大の敵なのである。その中には、どんな分布を選択するのかという分布選択バイアスすらある。標準分布を何にでもあてはめてしまおうとするのもその一つ。それがどんな結果をもたらしうるかは、「ブラック・スワン」が指摘し、その後にリーマン・ショックが来たのは記憶に新しい。
しかし、それでめげてはいけない。統計には、そのバイアスを見抜く方法もきちんと用意されているのである。それがどんな方法か、本書でぜひご確認していただきたい。
本書に強いて問題が一つあるとすると、縦書きであるにも関わらず横書きの専門書なみに数字と式を詰め込んだこと。これがあるが故に「統計思考力」も「統計数字を疑う」も本書のレベルまで踏み込めなかったとも言え、そんな「常識」を華麗にスルーしてくれた化学同人に拍手を送りたい一方で、しかし読みにくいことは否めず、ここまでやるのであれば横書きも辞さない方がよかったのではないか。
冒頭に「一体全体」という言葉が出てきた。統計とは、まさに「一部を見て全部を知ろう」とする技術である。うまくやれば2,000が250万に勝ち、開票と同時に「当選なう」と自信をもってつぶやける。カミオカンデでニュートリノを見つけたのもまた、統計。微積分、線形代数、に続く、「道具としての数学三種の神器」の三番目にして最も強力なのが統計なのだ。
本書のレベルまで統計が読めれば、だまされることもなくなる、というよりだまされてもすぐに気がつくだろう。繰り返す。プロだってだまされるのが統計である。大事なのはだまされまいと身構えるのではなく、決断に至る前にそうと気がつくことなのだから。
Dan the Black Swan
「2008年の登録失業者数は886万人で、失業率の実績は4.2%である」
失業率4.2%といえば、現在の日本と同レベルである。この数値を「思ったよりも良い」と思うか、「思ったよりも悪い」と思うかは人それぞれだと思う。だが、それ以前に、この文章を見た瞬間に「んん??」とピンとこなければ、その人は中国経済について語ることを差し控えておいたほうが無難である。
http://voiceplus-php.jp/web_serialization/china_economy/001/index.html