検定 ～偶然か？あるいは・・・～

今回は検定のお話です。先にざっくりと概要を説明しちゃうと、検定ってのはある確率的な仮説が正しいとすると、現実の結果とは矛盾する（矛盾しない）ことになるから、その仮説は間違っている（合っている）みたいな感じで確率的な仮説を正しい、正しくないと判断する手法のことです。昔の哲学者ソクラテスが用いた問答法に似てますな。

本当に偶然か？
まずは仮説を立てる（相手が正しいとする）
偶然である確率はどれくらい？
「偶然」を定義する
結局、コイントスはイカサマと言えるのか？

本当に偶然か？

もしも、ほとんど起こらないような状況が起こったとしたら、あなたは偶然だと思いますか？例えば、あるショッピングモールのすべての自動ドアが同時に開閉するということが起こったとき、それが偶然に起きたものだと思いますか？15回ルーレットを回して0が11回出る、30回のコイントスで21回裏が出るといったようなことが起きた場合、それは本当に偶然だと言えるのでしょうか？

ほとんど起こり得ないようなことでも、起こる確率がある以上、偶然であるとは言い切れず、かといって、偶然ではないとも言い切れないんですな。どちらとも言い切れない以上、それ以上の追及は不可能ってことになってしまうんです。もしも賭け事なんかで明らかにおかしいと思うようなことがあっても、「それは偶然に起きたものだから気にするな」と言われれば反論が難しくなり、泣き寝入りをするしかなくなってしまうわけですな。

それではあまりにも理不尽ではないか！ってことで、昔の人は考えたんですな。

もしも、とてつもなく起こりにくい現象が起きたら、それは偶然によるものとは言えないのではないかと。そこで、そういう現象が起こりやすいと言えるのか、あるいは言えないのかを評価する手法を編み出しました。それが検定（統計的検定）って手法になります。

まずは仮説を立てる（相手が正しいとする）

では、仮にコイントスの問題で、30回投げて21回が裏だったとします。それで妙だと思ったあなたはイカサマじゃないのかといったところ、「単なる偶然ですよ」と言われました。そこで、それが本当に偶然に起きたものなのかどうかを確かめたいと思ったとします。

要するに、30回中、21回も裏が出るのは偶然ではないだろうってことですな。ただ、「偶然ではない」って言い方では何をどう考えたらいいのかがあまり明確でないので「コインの表と裏の出る確率が違っている」と言い換えておきます。つまり、この問題において、本当に考えるべきことは何なのかを分かりやすくするために、より細かな言い方に変えたわけです。

で、もしも30回中、21回の裏って現象が本当に偶然に起きたものだとするなら、コインの表と裏の出る確率は等しいはずです。なので、相手の主張は

表の出る確率=裏の出る確率

ってことになるわけです。（仮に、コイン自体ではなく、外部の影響で確率が変わっているとしても、表の出る確率と裏の出る確率が操作されているわけなので、どういう方法で確率が変えられているのかは関係ありません）

もしも、間違いのない論理によって現実とは異なる結果が得られたとすれば、その前提、つまりは「表と裏の出る確率が等しい（偶然に起きたものである）」という主張が間違っているってことになります。なので、とりあえず「表と裏の出る確率が等しい」ということを仮定して計算（という論理）を進めていくことになります。

偶然である確率はどれくらい？

30回中21回が裏って結果が偶然に起きたと仮定した場合、その確率はどれくらいなのかを計算していくことになります。偶然にそれが起こる確率は\( {}_{30} \mathrm{C}_{20} \times 0.5^{21} \times 0.5^{9} \)で求められます。表計算ソフトなんかを利用してその確率を求めてもらうと0.013くらい（1.3%くらい）になるかと思います。

で、30回中21回以上が裏になる確率は0.021（2.1%）くらいになるかと思います。こっちの方は裏21回以上出る確率を全部足しただけです。21回裏が出る確率 + 22回裏が出る確率 + ・・・+ 30回裏が出る確率っていう風に計算したってことですな。

つまり、30回中21回裏が出るというのが本当に偶然で起こる確率は2.1%だと考えられるってことです。個人的には予想よりも少しだけ小さい感じがしたんですが、裏が多いパターンだけでなく、表が多いパターンもあるって考えたら、まぁそんなもんかって感じですな。

今回のような場合、裏の出る確率が操作されているのではないか、あまりにも裏ばかりが出すぎではないのかという疑問からこういう検定を始めたわけなので、考えるべき回数は21回ピッタリではなく、21回以上の方が妥当だと思うのです。なので、今回は裏が21回出る確率ではなく、裏が21回「以上」出る確率を基に話を進めていきます。

「偶然」を定義する

さて、ここまで「偶然とは思えない現象が起こったが、もしもそれが本当に偶然だとすると計算結果と現実の結果との間には差が生まれるはずだ」と考えて、30回中21回以上が裏である確率を求めたわけですが、一つ問題があります。「偶然」というのをどう定義するかってことです。

さっき、30回中21回以上が裏である確率は2.1%だという計算結果に対して、私は少し小さい気がしたって感想を言いましたよね。この感想ってのは人によっていろいろと変わるわけです。予想よりも大きいと感じる人もいれば、大体それくらいだと思ったって人もいるわけです。つまり、「偶然」のとらえ方、感じ方が違っているわけです。

当然、「偶然」という価値観が人によって異なる以上、それ以上の論理的な議論が難しくなってしまいます。そこで、解決策とも妥協策とも言える無理やりな考え方を導入することになります。

統計学の世界では、5%とか1%とかよりも小さければ、それは起こりにくいとしようとする考え方（というより文化に近いですかね）があります。

で、検定でもその考え方を持ってきて、5%なり1%なりよりも小さい数値であれば問答無用で「その現象は（きわめて起こりにくいと考えられるので）偶然ではない」とするんですな。

さて、今回は30回をワンセットとするコイントスを20セット行えば、その内1セットくらいは表が9回裏が21回って結果になってもおかしくはないかなと思ったので、今回は起こる確率が5%よりも小さければ偶然ではないとします。20セットのコイントス中、1回はそういう偶然もあるだろうと考えたってわけですな。

結局、コイントスはイカサマと言えるのか？

現象の起こる確率と偶然の定義さえできてしまえば、ここから先は簡単です。単に両方の数字を比較して機械的に結論を導くだけですから。それでは、最後のステップに参りましょー。

さて、もしもコインの表と裏の出る確率が同じであれば、30回中21回以上が裏である確率は2.1%だと求められました。そして、偶然ではないという確率は5%としました。つまり、これら2つから30回中21回の裏は偶然ではないと言えるわけです。

ただし、確率的な現象を扱っている以上、上でも述べた通り、確実に起こらないとは言えません。その確実性はどれくらいかというと5%になります。同じ試行を20セット行えば1セットくらいは30回中21回の裏といういわば例外的な現象が確認されても仕方がないっていうくらいの数値です。

とりあえず、以上が検定の考え方になります。今回の話で重要なのは、仮説 → 仮説の下での計算 → 計算結果と偶然の比較 → 結論って流れになりますので、それさえ押さえておいていただければと思う次第でございます。ではでは～。