2011年12月7日水曜日

ブショネによる統計学入門

少しは 12 月らしい寒さになってきたかな。 いつもの朝食のあと出勤。 昼食は持参のお弁当。鶏挽肉とバジルの炒めものかけ御飯。 つまり昨日の残り物。 夕方、退社。 夕食は、もつ鍋風の鍋焼饂飩を作ってみた。 お風呂に入って、湯船で 「酒の肴・抱樽酒話」(青木正児著/岩波文庫) より「適口」を読む。

昨日の 「3 の法則」の問題 の解答。 色々な統計的手法がありうるが、おそらく一番簡単な考え方はこうだろう。 あるワインのブショネ率を p とする。 n 本続けてブショネに当たらなかった時、この p を評価したい。 一本のワインがブショネでない確率は (1 - p) だから、 n 本続けて当たらない確率は (1 - p) を n 回かけたものになる。 この確率をどうにか見積もりたいが、 今、目の前にあるのは、n 本試してもブショネに当たらなかった、 という事実だけだ。さて、どうする(ここが統計的推測の肝)。 こういうときに統計学で一番普通に用いるのは、 「起こる確率が 5 パーセント以下であるような珍しいことがたまたま起こったとは考えないことにしましょう」、 という議論である。 つまり、(1 - p) の n 乗は 0.05 以上だろう。 (「なるほど?」と今、簡単に納得した人に注意しておくが、 このマジカルな論法は考えれば考えるほど巧妙であるし、 その意味するところは深遠である。)

あとは、この不等式を p について解くだけだが、解析学が少々必要。 実際、両辺の log (自然対数)をとり、n で割り、 p が小さいとき log (1 - p) はほぼ -p に等しいという近似を用いれば、 -p ≧ log(0.05)/n となって、 log(0.05) は -2.995... でほぼ -3 なので、p は約 3/n 以下。 結局、答を一言でいうならば、 「log(0.05) がほぼ -3 だから」ということになる。

ちなみに、上の仮定の「5パーセント」という数字は恣意的である。 この数字を小さくとるほど、 推測が外れることが少ないという意味で安全だが精度の意味で弱い評価が得られ、 逆に大きくとるほど、危険だが強い評価が得られる。 よって、問題に応じて適切に(事前に)選ぶ必要がある。とは言え、 多くの日常的な問題では何げなく 5 パーセントにすることが多い。 このあたりも深く考え出すと迷宮に入り込む危険性があるのだが、 とりあえず今日説明した論法が、 初歩の統計的推測のポイントの一つだろう。