2012年1月13日金曜日

邪悪な統計家を統計する

いつもの朝食のあと出勤。 今朝も気温は低いが、風がなく、天気も良いので温かい。 昼食は持参のお弁当。 毎週定例の全体ミーティングのあと、夕方帰宅。 夕食は、白菜と牛肉のタイ風炒めもの、 蕪の漬物、大根と里芋と人参の味噌汁、御飯。 夜は、晩酌をしながら読書など。 蕪を網で焼いて、もろみを添え、酒を冷や(常温)で五勺ほど。

昨日の 「邪悪な統計家の問題」 について。 もし彼が正直な統計家なら何も問題はない。 彼は何故か 3022 回という実験回数をたまたま選んだのだろう。 そして、コインは高い確率で歪んでいる。 しかし、彼が邪悪な統計家で、望む結果になったところで実験を止めたならば、 3022 回の内 1583 回表が出た、という数字には意味がない。 確率論に詳しい方なら、望みの結果が得られるまで 3022 回の実験が必要だった、 という事実から何か評価を導こうとするかも知れないが、 それにはさらに多くの仮定が必要であり、(乱歩の演習問題としては面白いが)有効とは思えない。 そして、困ったことに、私は彼がズルをしたのかどうか知らない。 少なくとも頻度統計の立場からは、この状況から何の結論も導けそうにない。

しかし、ベイズ推定の立場から考えることができる、という主張が "Ted Bunn's Blog" の こちらの記事。 ベイズ推定では、 私がそのコインに対して事前に持っていた信念を表す確率(事前確率)が、 実際の実験結果によって更新される、と考える。 そしてこの場合、実験をした統計家が正直だろうと邪悪であろうと、 「関係ない」。 とにかくデータが増えていけば、私の心の中の主観的な確率である、 コインに対する信念を表す確率は更新されていく。 さらに、適当な仮定の下で、このベイズ推定の結果、 私はこの実験結果からコインの公平さについての信頼を 「高める」だろう (具体的な計算例は、リンク先の Ted Bunn の記事にある)。 通常の仮説検定では 99% の信頼区間で、公平でないと判断する、まさにその同じ実験結果によって、 私は実験前よりもコインはより公平であると(信じられると)、判断する。 これは見かけほど意外ではない。 実験前には私はこのコインの公平さについて確信していたわけではないが、 実験後には、3022 回中で表が 1583 回というかなり半数に近い数字を得たのだから。

もう一つ、面白い主張をしていたのは、 "Probably Overthinking It" blog の こちらの記事。 私はこの状況から、 「統計家が正直か邪悪かを」統計的に推測できる。 論法は以下の通り。 彼が邪悪な統計家であったときにコインが歪んでいるという結果が出る(条件付き)確率はほとんど 1 である。 一方で、彼が正直な統計家であったときにコインが歪んでいるという結果が出る確率は、 コインは公平であるのに(誤って)歪んでいるという結果が出る確率と コインは歪んでいて正しくそれが検出される確率の和である。 これらはコインが公平である確率が与えられれば計算できるが、 実験前における私のコインの公平さへの信念(事前確率)を流用してよいだろう。 よって上の確率は計算可能であり、 二つの条件付き確率の比から、統計家が邪悪かどうか推定できる。 実際、リンク先の記事では、 適当な仮定の下、この統計家が高い確率で邪悪である(!)ことが導かれている。