スポンサーリンク

確率密度関数 ~ある事象の起こる確率はゼロ!?~

記事内に広告が含まれています。

この記事では確率密度関数という概念について説明していきます。

確率密度関数ってのは、ざっくりと説明しておきますと、ランダムに発生するデータが原理的に連続的な数値を取るときに、そのデータがどの辺りに発生しやすいかを表した関数のことです。

身長とか体重みたいに原理的に値がトビトビにならない数値に対しての確率を考えるときに使われる概念ってことですな。

反対に、原理的にトビトビになる数値にはどういうものがあるかと言いますと、例えばサイコロを投げた結果とかコイントスの結果なんかが挙げられます。

この記事では、確率密度関数をもう少し掘り下げて説明していきます。

と、その前に前提知識として「離散分布」「確率密度」「連続分布」がどのような概念か、なぜ必要かを説明してから「確率密度関数」について説明していきます。

スポンサーリンク

離散分布

まずは離散分布から。

離散分布は、上でサイコロとかコイントスの例で挙げたような離散的な事象と、その事象が発生する確率との対応付けのことを言います。事象と確率との対応付けを離散分布と言うわけですな。

そう考えると、離散分布はある種の関数として考えることもできます。変数にある事象xを代入してやると、その事象が起こる確率が結果として返されるってことですな。

サイコロの場合を考えてみます。単純に考えると、どの目も出る確率が同じだと考えられるので、出目1に対応する確率は6分の1、他の面も同じように考えてやれば、どの面も6分の1が対応付けられることになります。

Xを確率変数として、xを実際に起こった事象とします。つまり、Xは1から6までのどれかで、xは実際に観測された結果というわけです。その場合、先ほど説明した対応付けはf(X=x)として表されることになります。実際に2が出る確率はf(X=2)と表され、その結果は6分の1です。つまり、こんな風になります。

$$
\begin{equation}
\begin{split}
\ f(X = 1) &= \frac{ 1 } { 6 } \\
f(X = 2)&= \frac{ 1 } { 6 } \\
f(X = 3)&= \frac{ 1 } { 6 } \\
f(X = 4)&= \frac{ 1 } { 6 } \\
f(X = 5)&= \frac{ 1 } { 6 } \\
f(X = 6)&= \frac{ 1 } { 6 } \\
\end{split}
\end{equation}
$$

試行の結果として取り得る事象すべてをXで表していて、その内の1つがxで表されており、実際の事象が決まったら(確率を知りたい事象が決まったら)その事象を実際にxに代入したと考えると分かりやすいかもしれません。

ちなみに、この対応関係を表した表のことを確率分布表と言います。確率分布表を棒グラフで表現したものを確率分布図と呼びます。

連続値を取る確率は厳密にはゼロ

連続分布も、ある数値が発生する確率を関数の形で表そうとするのは同じです。ただし、連続分布の場合はちょっと厄介なことがあります。ある数値とその数値が起こる確率を対応付けたら、どの数値に対しても0が対応付けられてしまうという問題があるのです。

連続値の場合は小数点以下の桁を限りなく増やして、ある数値を限りなく厳密にしていくことができるって性質を持っています。この性質が厄介なことを引き起こしてるんです。

身長の話で考えてみます。例えば、150cmの人がいる確率というものを考えたいとします。ただし、身長が連続値であることに注意してください。150cmと言ってしまうと、小数点以下の桁をどれだけ増やしていっても0が並ぶような厳密に150ぴったりな数値のことを指してしまいます。150.01cmでもなければ150.004cmでもない150.000…(0が延々と続く)を表すことになってしまいます。

なので、実際に測定してみる(思考実験でもいいけど)と、本当に150cmピッタリである確率は0に等しいということになってしまいます。というのも、測定結果が世間一般に言う”150cm”ではあっても、厳密には”150cm”であるとは限らないのです。

測定結果をより厳密にすると150.02かもしれないし、150.004かもしれないし、149.9927かもしれないし、…、となってしまって、測定結果が150ピッタリになるよりも、150以外の数値になる確率の方が圧倒的に大きくなってしまいます。つまり、測定された身長が厳密に150cmである確率は限りなく0に近くなってしまいます。

もうちょっと一般的な言い方をすると、
ある数値aの観測される確率を考えようとしてみます。ただし、このaは厳密に寸分の誤差もなくaであるということになってしまいます。観測される数値を厳密にしていってもぴったりaであるということはまず考えられません。その意味で、aが観測されることはありません。なので、ある数値aが発生する確率は0になってしまいます。他の数値についても同じように考えていくと、どの数値であっても例外なく発生する確率は0になってしまうと考えられます。
といった感じでしょうか。

この考え方では、どの数値であっても発生する確率が0ということになってしまい、どんな数値もまったく起こり得ないということになってしまいます。ただ、現実には150.0239…cmという数値が発生しているわけなので、どの数値も発生する確率が0と考えられるという論理と矛盾してしまいます。

確率は理論的に考えていくと0ということになる。ただし、現実にはそうならない。さてどうしたものか?ということで考え出されたのが確率”密度”という考え方になります。

スポンサーリンク

確率”密度”とは

確率密度は、得られる数値がどの辺りである確率が高いかを表した数値になります。ある数値の確率密度が大きければ大きいほど、その周辺の数値が得られる可能性が高いことを表します。反対に、確率密度が小さければ小さいほど、その周辺の数値が得られる可能性が低いことを表します。

上でも説明した通り、厳密に理論的な話をすればある連続的な数値が発生する確率は0になってしまいます。そこで、ある数値が発生する確率を考えるのではなく、現実に発生する数値のばらつき方に目を向けてやります。

連続値であれば、どこまでも桁を追加して厳密にしていくことができます。ただ、どれだけ厳密にしてもある数値は別の数値の近くにあるということは変わりません。例えば150.0239…という数値は150.1よりも150に近い数値ということには変わりないわけです。

つまり、ある数値aが発生したら、その数値aには近くに別の数値bがあると考えられるわけです。そして、ある数値a(身長の例で言えば150)に近い数値b(150.0239…)の発生の仕方にはばらつきがあるはずです。140に近い数値よりも150に近い数値の方が発生しやすいとか、150に近い数値よりも160に近い数値の方が発生しやすいとかです。

ということは、厳密に150ぴったりな数値が発生する確率は0であっても、150に”近い数値”が発生する確率は0ではないと考えられるわけです。周辺の数値の発生のしやすさをある一点にまとめて表していったもの、それが確率密度となります。

確率密度関数

連続分布はある数値とその確率密度とを対応付けさせたものです。その連続分布を関数の形で表したものが確率密度関数になります。

離散分布では「ある数値→確率」って対応付けをしてたところが、連続分布になったら「ある数値→確率分布」になったわけですな。それに伴って、確率の表され方も離散分布のときとはちょっと違っております。

離散分布の場合は、考えたい数値に対応した確率を読めば、そのまま確率が分かるようになっておりました。

連続分布の場合は、考えたい「区間」に対応した面積を計算しなければなりません。連続分布は数値と確率の対応付けで、その対応付けは確率密度関数という関数で表現されているのでした。その確率密度関数をグラフで表したときに、面積が確率を表すってことですな。

なので、例えば身長で世間一般に言う”150cm”の人が存在する確率を確率密度関数から調べようとしたら、149.95以上、150.05未満の区間に対応した面積を計算すれば、その面積が求めたい確率になるってことですな。

数値と確率密度の対応付けとしてよく出てくるものに、正規分布ってのがあります。一応、その式を載せときます。こんな感じです。

$$ f(x) = \frac{ 1 } { \sqrt{ 2 \pi \sigma^2 } } \exp( -\frac{ ( x – \mu )^2 } { 2 \sigma^2 } ) $$

ここでいう\( \mu \)、\( \sigma^2 \)はそれぞれ平均値分散です。

上の世間一般に言う”150cm”の人が存在する確率ってやつを求めたければ、平均値と分散を設定して、149.95から、150.05までのf(x)の値を足していけばいいわけですな。カンの良い人はすでにお気づきかもしれませんが、この計算は積分の計算そのものです。

ベイズ統計をやろうとすると、確率密度関数がどうのこうのって話が大量に出てきます。なので、ベイズ統計をやろうとすると、積分計算は必須になってきます。

ベイズ統計を使わない人でも、標本調査とか検定みたいに、ただ統計分析をしたいだけって場合でもなぜその計算なのか?といった辺りのことを知りたいと思ったら積分が必須になってきたりします。

というわけで、今回は積分についての本をおすすめしときます。

積分を使えるようになりたいってだけであれば、積分が本当に正しいのかどうか、厳密な話を成り立つのかみたいな正確性や厳密性を重視する数学書よりも、積分を利用するに当たって必要なのはどんな考え方か、もし忘れても思い出せるように、便利な定理については証明が付けられているっていう感じで、積分の利用に焦点を当てた工学系の本の方がおすすめなので、こんな本を紹介しときます。

積分の考え方を理解したいだけなら、高専の数学2の微分と積分の章だけを読めば十分です。便利な式変形を知りたければ高専の数学3の方をどうぞって感じです。

 

P.S.
僕が勉強したのがこの本で、他の本はサラッとしか目を通してなくて、おすすめできるのがこれしかないんです。なので、絶対にこの本がいいってわけではないと思いますので、この本にするかどうかはお任せします

タイトルとURLをコピーしました