今回は、僕のツイートに対して質問をしてくださった方がいらっしゃいましたので、その回答と色んな補足を書いていこうかと思います。
さてさて、時は少し戻りまして、2019年2月23日です。私はこんなツイートをしておったのです。
頻度論とは、中学校で習う確率がどうこうといった話をする分野で、ある現象が起こった確率を考える分野だ。ベイズ論は、ある現象が起こる確率を不明な要素があっても答えを出そうとする分野だ。視点を変えた頻度論と言うこともできるだろう。
— データマイナーAkito (@Akito_Dataminer) 2019年2月23日
で、このツイートに対して、頻度論とベイズ論の説明が逆になっているのではないかとご指摘を受けたんですな。いやぁ~、こんなにも学習意欲の高い方にもフォローしていただけてるとは嬉しいかぎりでございます。
すみません!間違ってました!m(__)m
で、質問の回答なんですけど、確かに間違っておりました!すみません!なので、訂正させていただきます。
『頻度論は不明な要素があっても答えを出そうとする分野、ベイズ論はある現象が起こった確率を考える分野』です。
なので、もしも僕のツイートで勉強されてる方がいらっしゃったら、この記事を読んで、理解を更新して頂ければと思います。
頻度論とベイズ論は視点が違う
頻度論にしてもベイズ論にしても、未知の確率を探る。当たったり間違ったりするけど、当たる方が多い結論を出すって意味では同じなんですけど、頻度論とベイズ論では結論を出すときの視点に違いがあるんですな。
例えば、ある母集団からある程度大量のデータが取れたとして、そこから全体がどうなのか知りたいとする場合、 (母集団としては、例えば、都市ごとの投票数とか年齢ごとの破産数、いろんな商品の売れ行きなんかが考えられます)
頻度論ではデータを得られると、一つの母集団を仮定して、その母集団ってどんな特徴を持ってるんだろう?このデータからどんな特徴を持っていると言えるだろう?って考えて結論を出します。
他方、ベイズ論ではデータを得られたら、まず母集団が大量にあるって考えます。その大量にある母集団から、偶然そういうデータを生み出す母集団はどれだろう?どの母集団を仮定したときが一番妥当だろう?って考えるんです。
つまり、最終的には最も妥当だと思われる母集団の特徴(平均値や分散)を導き出すって点では同じなんですけど、その結論に至るまでの考え方が違うってことです。頻度論ではデータから母集団を探そうとして正しい母集団を見つけようとして、ベイズ論では母集団にちょうど合うデータを探して正しい母集団を決めようとするって違いがあるんですな。
頻度論は得られたデータに対して、母集団の特徴は一つであると仮定するけど、ベイズ論は得られたデータに対して母集団の特徴は複数であると仮定するっていう風にも言い換えられますね。
頻度論は全体を推し量り、ベイズ論は原因を突き止める
頻度論は母集団の確率分布が見えていない状態からスタートして、一部のデータからその母集団を徐々に形作っていき、最終的に全体を推し量るって考え方で予測を進めていくので、データから全体を推し量るってことが得意ってことになりますね。
ベイズ論は母集団を大量に予測しておいて、その中から、手元にあるデータが取れる確率が最も高そうな母集団はどれかを突き止めるって考え方で予測を進めていくので、結果からその前提条件、つまりは最も確率の高い原因を突き止めるのに向いているって考えられます。
だから、頻度論は一部から全体を予測しようとする、不明な点があったとしてもとりあえず考えられる範囲で見合う結果を返すって意味では、『頻度論は不明な要素があっても答えを出そうとする分野』と言えます。
ベイズ論は、色んな結果を予測しておいて、最もその結果に見合う原因を探ろうとするって意味では、『ベイズ論はある現象が起こった確率を考える分野』と言えます。
※僕はPSYCHO-PASSってアニメが大好きなんですが、その中で犯罪係数っていうのが出てくるんですな。ざっくりと言うと、その人がどれだけ社会に問題を起こしやすいか(犯罪を犯しやすいか)ってのを表した数値で、その数値が高ければ高いほど危険人物としてみなされます。
で、その犯罪係数を、その人の行動や脳の反応という結果から犯罪者になる確率を割り出していると考えれば、どれだけ犯罪を犯しやすいか、犯罪を犯す確率はどれくらいか、社会への脅威はどの程度かを求めるのはベイズ論で、適当に人を集めて得られた一部のデータから犯罪係数の高い人がどれくらい存在しているかを割り出すのが頻度論ってことになりますねー。
はい、という、まぁ、、、余談でした。