西内啓『統計学が最強の学問である』

西内啓『統計学が最強の学問である』

 京都府立医学大が、高血圧治療薬ディオバンの効果を調べた臨床研究論文に、データ操作による効果水増しがあったという調査結果を発表した。おまけにデータの統計解析をしたのが、販売元の製薬会社ノバルティスの社員だったというから驚く。(朝日新聞7月12日付)グーグルのヴァリアン博士は「これから10年でもっともセクシーな職業は統計家である」というが、日本の大学で統計学を専攻できるのは総合研究大学院大学だけで、学位も103人で、アメリカに比べると遅れている。この本の著者・西内氏は、日本企業は勘と経験が相変わらず多く、統計学の基礎となる「データ集計力」は優れているが、統計解析は遅れているという。(「AERA」7月22日号)京都府立医科大でも、専門の統計解析者を入れていなかった。
 西内氏の本が売れているのは、日本の統計学リテラシー軽視の状況にあるからだと思われる。IT時代には、統計学が花開く。ビックデータの集計がどんなにあっても、「統計解析」の専門的素養がなければ、宝の山も役に立たない。この本を読むと、社会調査や疫学・生物統計学、IQなど心理統計学計量経済学、言葉を分析するテキストマイニングから、企業のマーケティングにおけるデータマイニングまで、いまや統計学はかかせない事がわかる。
 肺ガンとタバコ喫煙の相関が統計学により明らかにされたが、西内氏の本で統計学の基礎がよくわかる。サンプリング調査の重要性や、誤差や因果関係の問題、ランダム化比較実験と回帰分析やバスケット分析などにより、最善の答えを科学的な根拠(エビデンス)により引き出すという統計学の重要な考え方が説かれている。
 さきの高血圧薬の効果偽装をかんがえながら、西内氏の本を読んでいたらこういう件りが書いてあった。事前になんらかの確率を想定するか、しないかのベイズ派と頻度論派の話である、新しい薬の使用承認判断は、もっとも間違いが許されない。何の効果もない薬に医療保険が使われるのは社会的損失だし、命がかかわるかもしれない。「そのため回帰モデルによる調整や、傾向スコアの使用すら許されず、ランダム化比較実験を行った結果、誤差とは考えられないレベルの有効性を示したものだけが承認される、というのが国際的常識である。」と。仮に効くか効かないかが五分五分だと仮定する事前確率などもってのほかということになる。因果推論をミスリードする仮定はないほうがいい。統計学の知識は、市民にも必要だとこの本を読み思った。
 だが私のように個人主義であり、普遍=一般よりも、特殊を好むアマノジャク的人間にとっては、統計学的・集合論的思考はとても最強の学問とは思えない。必要な学問とは思うが。また疫学と社会調査と、広告など消費社会のマーケッティングを同次元で取り扱う同質思考は違和感をもつ。私は常に「誤差的人間」でいたいから、データを取られることも拒否したい。統計学還元主義には、心理操作的な暗示を含んでしまう危険性もあるのではないか。(ダイヤモンド社