ベイズ統計をやってると必ず出てくると言っていいくらいに有名な問題にモンティ・ホール問題ってのがあります。こいつは主観確率を利用してやると解くことができるんで、主観確率を扱うベイズ統計にはぴったりの問題なんですな。
モンティ・ホール問題は、選択肢をある条件下で減らすゲーム
モンティ・ホール問題をざっくりと説明します。ゲームのルール形式で説明していきます。その方が分かりやすいような気がするので。
まず前提として、ゲームの参加者が2人、選択者と出題者(ゲームの進行役)がいます。出題者は選択肢を3つ用意しておきます。3つの内どれか一つの選択肢を当たりに(例えば、選択肢が3つのドアならドアの後ろに景品を用意)しておきます。出題者は当たりの選択肢を知っています。
1.そういった前提があった上で、選択者は3つの選択肢から一つを選びます。
2.選択者が選んだ選択肢と景品がある選択肢以外の内、1つの選択肢を除外します(ドアを開ける)。つまり、選択肢を2つにする。
3.進行役は選択者に「この状態で、あなたは選択肢を変更しますか?それともしませんか?」と尋ねる。
4.選択者は選択肢を変更するか変更しないかを選ぶ。
5.進行役は選択者の選んだ選択肢が当たりかハズレか結果を教える。
6.ゲーム終了
ってのが、ゲームの流れです。3番目の状態で変更した方が当たりを引きやすいのか、それとも変更しない方が当たりを引きやすいのかどちらでしょう?ってのが問題です。
ってことで解いていきたいところですが、問題を解く前に、ゲームの流れを追ってみましょう。
まずは選択肢の用意。選択肢を例えば A B C って風にしたとします。次に当たりを作る。Cを当たりにしておきます。次は選択者の選択がゲームにどう影響するかを考えていきます。
選択者が例えばAを選んだ場合、Aは選択されてる、Bは当たりでなく選択されてもいない、Cは当たりである。なので、Bが選択肢から除外されます。つまり、A Cが残るわけです。その状態で選択者は変更するかどうかを聞かれることになります。
選択者がBを選んだ場合は上の例のAとBが入れ替わるだけです。
選択者がCを選んだ場合、AとBは当たりでなく選択されてもいない、Cは当たりでありかつ選択されてもいる。なので、AかBかのどちらか片方が選択肢から除外されます。つまり、A Cが残るか、B Cが残るかになります。その状態で変更するかどうかを聞かれることになります。
「変更してハズレだった場合は後悔する羽目になるから変更しない」とか「結局、景品が隠れている確率は3分の1だから変更しなくてもいい」みたいな変更しない派がいたり、「なんか仕掛けがありそうだから、あえて変更しよっ♪」みたいな変わった人(ハイ、ボクデス。。)がいたりするんですが、ちょい待てよと。実際に確率を計算してみるとどうなるのよ?ってのをこの記事では見ていきます。
選択肢を変えた方が2倍当たりやすい(ベイズ統計的には)
ここで、もう一度問題を整理しておきます。問題は、「選択肢が3つあるうち、1つが当たりである。どれか1つが選択されたら当たりでなく、選択されてもいない選択肢を除外する。その状態では選択肢を変更した方が当たる確率が高くなるでしょうか?それとも選択肢を変更しない方が当たる確率が高いでしょうか?」って感じですな。
結論から先に述べてしまいますと、変更した方が、なんと、「2倍も」当たりやすいです。なぜ当たりやすいのか?2倍という数字はどこから出てきたのかを説明していきます。
次の2段落は前提を、3段落目は目指すところを書いております。
まず、「Aが当たりである」という事象をA、同じように「Bが・・・」をB、「Cが・・・」をCとしておきます。Xを任意の事象として、P(X)で「Xが当たりである確率」を表すことにします。要するに、P(A)って書いてあったら「Aが当たりである確率」って読み替えてくださいねーってことですな。
次に、データDが分かったときの条件付き確率をP(X|D)と表すことにします。今回の例で言えば、例えば「Bが当たりでない」が分かった状態(D=「Bが当たりでない」)での、Aが当たりである確率はP(A|D)となるわけですな。(今回みたいに文字を定義すると、P(A|B)って書いちゃうとBが当たりである上でAが当たりである確率になっちゃいますのでご注意を。)
つまり、目指すところはP(X|D)をそれぞれ計算して、P(X)と比較するとどれくらいの違うのかを見るってとこです。ただ、実際に計算するのはP(A|D)、P(B|D)、P(C|D)の内、どれか2つということになります。どの2つを計算しなければならないかは問題の設定によって変わってきます。そのあたりも含めて次の項目で説明していきます。
理由不十分の原理
まずは問題設定です。当たりと選んだ選択肢、データDの設定です。ここでは、当たりはC、選んだ選択肢はB、なので、Dは「Aが選択肢から除外される」です。状態としては、残りの選択肢が2つになった状態(手順3)です。なので、求めるべきはBでないというデータが得られた上でのAが当たりである確率、Cが当たりである確率です。
では、張り切って計算していきましょー!と言いたいところなんですが、最初(手順1の状態)は特に条件が無いので、P(A|D)どころかP(A)、P(B)、P(C)すら決められないことになります。
ってことで、まずA、B、Cの起こる確率を決めてやるためにベイズ統計には理由不十分の原理ってのがあります。ざっくりと言えば、特に何の根拠もないなら、各事象の起こる確率は一緒と考えても問題ないよねー、っていう考え方のことです。
ここでは理由不十分の原則を適用して、
$$ P(A) = P(B) = P(C) = \frac{1}{3} $$
としておきます。当たりである確率はどの選択肢でも変わらない、確率はすべて足し合わせると1にならないといけないって2つの理由から、A、B、Cそれぞれが当たりである確率を3分の1にしてます。
次に、本題であるP(B|D)とP(C|D)を計算していきます。ここではベイズの定理(いずれ解説記事を書くので、分からない方は、今はそういうもんかと思ってください)を利用します。すると、
$$ P(B|D) = \frac{ P(D|B)P(B) } { P(D|A)P(A) + P(D|B)P(B) +P(D|C)P(C) } $$
となります。ここで出てきたP(D|A)はそれぞれAが当たりであるという条件の下で、データDが取れる確率を表しています。P(D|B)、P(D|C)も同じです。
要するに、「Aが当たりである」が前提条件の場合、データD(今回の例で言えば「Aが除外される」とか)が取れる確率ってどれくらいあるの?ってのを表してるってことですな。P(B|D)を計算するためにはP(D|X)を計算しておく必要があるわけです。
ってことで、順にみていきましょー。
まずP(D|A)は0です。今回の場合、Dは「Aが除外される」を表していて、Aは「Aが当たりである」を表してるんで、P(D|A)は「(選択者がBを選んでいる状態で、かつ)Aが当たりであるという前提条件の下で、Aが除外される確率」を表しています。ゲームのルールから当たりが除外されることは無いので、\( P(D|A) = 0 \)です。
続いてP(D|B)です。Bは「Bが当たり」を表してるんで、P(D|B)は「Bが当たりであるという前提の下で、Aが除外される確率」を表してるってことになります。ただし、今回の場合は選択者はBを選んでたわけです。なので、Bが当たりである場合、除外されるのはAでもCでも問題ないことになります。というわけで、\( P(D|B) = \frac{1} {2} \)となります。
最後にP(D|C)です。P(D|C)は「Cが当たりであるという前提の下で、Aが除外される確率」となります。この場合、選ばれてるのはB、当たりはCとなるので、必然的に除外されるのはAになります。つまり、確実にAが除外されることになります。てことで、\( P(D|C) = 1 \)となります。
ここまでで必要な数値が計算できましたので、今度こそP(B|D)を計算していきましょう。
$$
\begin{equation}
\begin{split}
\ P(B|D) &= \frac{ P(D|B)P(B) } { P(D|A)P(A) + P(D|B)P(B) +P(D|C)P(C) } \\
&= \frac{ \frac{ 1 } { 2 } \times \frac{ 1 } { 3 } } { 0 \times \frac{ 1 } { 3 } + \frac{ 1 } { 2 } \times \frac{ 1 } { 3 } + 1 \times \frac{ 1 } { 3 } } \\
&= \frac{ \frac{ 1 } { 2 } } { \frac{ 1 } { 2 } + 1 } \\
&= \frac{ 1 } { 3 } \\
\end{split}
\end{equation}
$$
同じように考えて、P(C|D)を計算してやると、
$$
\begin{equation}
\begin{split}
\ P(C|D) &= \frac{ P(D|C)P(C) } { P(D|A)P(A) + P(D|B)P(B) +P(D|C)P(C) } \\
&= \frac{ 1 \times \frac{ 1 } { 3 } } { 0 \times \frac{ 1 } { 3 } + \frac{ 1 } { 2 } \times \frac{ 1 } { 3 } + 1 \times \frac{ 1 } { 3 } } \\
&= \frac{ 1 } { \frac{ 1 } { 2 } + 1 } \\
&= \frac{ 2 } { 3 } \\
\end{split}
\end{equation}
$$
となります。B(選んでた方)が当たりである確率P(B|D)が \( P(B|D) = \frac{ 1 } { 3 } \) だったのに対して、C(選んでなかった方)が当たりである確率P(C|D)が \( \frac{ 2 } { 3 } \) なので、Bが当たりである確率よりもCが当たりである確率の方が2倍高くなるわけです。
以上が、モンティ・ホール問題のベイズ統計的な解になります。(今回解説しなかったパターンについてはご自身でお確かめくださいってことにしておきますので、興味がある方はどうぞ~)