そもそも検定ってのは、ある確率的な事柄が偶然起きたのかどうかを確かめるための手法になります。検定では「否定したい主張が正しいとすると」という帰無仮説を立てておいて、その仮説を否定する方が妥当なのか、あるいは否定しない方が妥当なのかを結論付けます。詳しくは検定 ~偶然か?あるいは・・・~あたりをご覧くださいませ~。
そんな検定の中でも今回は、F検定と呼ばれる検定についての話です。
F検定は、2つの正規母集団の母分散が同じと言えるかどうかを確かめるために考え出された検定になります。F検定が理解できると分散分析が理解できるようになります。分散分析は検定の一種で、ざっくり言うと、3つ以上の要因が考えられて、データにも差があった場合、その差が本当にその要因によるものなのか、それともただの誤差(偶然)で生じたものなのかを確かめる検定になります。
もしも分かりづらかったら、後ろの方にある問題設定の節から最後まで読んでもらってから、前の節を読んで頂ければ、具体例が頭の中にある状態で読み進められるので、多少分かりやすいかと思います。
F値から分散が同じかどうかを見る
F検定というのは上でも書いた通り、2つの”正規”母集団の母分散が等しいかどうかを検定するので、F検定でまず立てる仮説は「2つの正規母集団の母分散が等しい」という仮説になります。その仮説の下でF値というものを計算します。そしてF値に応じて、結論「仮説が棄却される(母分散が等しいとは言えない)」か「仮説は棄却できない(母分散が等しいと言える)」を出すことになります。
ここで出てきたF値というのは次の式で計算される数値になります。2つの正規母集団にAとBという名前を付けておきます。添え字にAを付けていれば母集団Aについての変数、添え字にBが付いていれば母集団Bについての変数ということにします。\( s \)と\( \sigma \)はそれぞれ母集団A(またはB)から抽出した不偏分散と、母分散を表しています。その不偏分散\( s \)の自由度は\( k \)として表します。標本の数を\( n \)として表せば自由度は\( k = n – 1 \)ということになります。
$$ F= \frac{ \frac{ s_A^2 } { \sigma_A^2 } } { \frac{ s_B^2 } { \sigma_B^2 } } $$
この式は、AとBそれぞれについて母分散と不偏分散の比を計算して、計算したAとBそれぞれの比をさらに比を計算するとF値が計算できるということを表しています。分散比の比とでも言うような感じですな。
もしも母集団が”正規”母集団と仮定できるのであれば、このF値は自由度\( k_A \)、\( k_B \)のF分布に従うという性質を持っています。その性質を利用して2つの母分散が同じと言えるかどうかを検定することができます。
F分布からF値の偶然性を疑う
F分布というのは次の図みたいな形のグラフで表される確率密度関数になります。縦軸が確率密度で、横軸がF値です。F分布は自由度が決まらないと描けないので、自由度は9と19ということにしました。後ろの例でもその自由度で計算していくので。
この図は、大体1よりも少し小さいくらいの数値が最も出やすくて、そこから遠ざかれば遠ざかるほど出にくいということを表しています。ただし、F値が0.1辺りから3辺りまではそれなりに出る確率はあるということも読み取れます。
つまり、F値が0.1から3くらいの範囲内であれば「まぁ、偶然そうなることもあるよねー」って考えられるけど、F値が0.1よりも小さかったり、3よりも大きかったりすると「これって本当に偶然そうなったの?何かしらの影響があったり、どこかに間違いがあってこんな数値が出たんじゃないの?」って考えられるってことですな。
F検定をするに当たっては、この「まぁ、偶然そうなることもあるよねー」と考える範囲を先に決めておきます。有意水準の設定ってやつですな。検定 ~偶然か?あるいは・・・~でいえば「偶然を定義する」って箇所になります。
有意水準が決まれば棄却域が決まります。つまり、F値がどの範囲の値を取ったら仮説を否定するかが決まるってことですな。
上に挙げた式からF値を計算して、もしもF値が棄却域の中に入っていれば、有意水準何%で否定できるという結論になりますし、F値が棄却域の中に入っていなければ、有意水準何%で否定できないという結論になります。
問題設定
というわけで、計算したF値が偶然その値になる確率から母分散が同じと言えるかどうかを検定するという考え方は分かっていただけたかと思いますので、ここから例題を解いていきます。相も変わらずオレンジの例題をやっていきます。
例題
ある農園でオレンジを作っていて、オレンジの木が2か所で育てられているとして、片方をA、もう片方をBとします。農園の管理者は、場所Aで採れるオレンジと場所Bで採れるオレンジでは、重さのばらつき方が違うように感じました。重さはなるべく一定であった方が、収入が安定するので嬉しいと思った管理者は、重さのばらつき方が同じかどうかを調べることにしました。そこで、2か所で育てられているオレンジを適当に取り出して標本調査をすることにしました。その結果、次のようなデータを取ることができました。
(単位はg)
場所Aで採れたオレンジ:252 291 283 211 234 285 262 245 307 234(データ数:10)
場所Bで採れたオレンジ:211 254 263 274 265 233 244 199 223 266
245 273 238 236 264 247 251 239 261 228(データ数:20)
さて、この標本から、場所Aで採れたオレンジの重さのばらつき方と場所Bで採れたオレンジの重さのばらつき方は同じだと言えるでしょうか?
要するに、上のようなデータが取れた場合、場所Aのオレンジの重さと場所Bのオレンジの重さのそれぞれの分散が果たして同じだと言えるかどうかが知りたいというわけですな。
仮説と有意水準の設定
さて、検定を進めていくに当たって、まずは帰無仮説と有意水準を決めていきます。
帰無仮説\( H_0 \)は「場所Aで採れたオレンジの重さの分散と場所Bで採れたオレンジの重さの分散が等しい」とします。F値を求める式で言うと、\( \sigma_A = \sigma_B \)ということになります。なので、対立仮説\( H_1 \)は「場所Aで採れたオレンジの重さの分散と場所Bで採れたオレンジの重さの分散が等しくない」になります。対立仮説ってのは、帰無仮説が棄却されたときに、消去法的に正しいということになる(採択される)仮説のことです。
次に、有意水準を決めます。今回の問題では、オレンジが重すぎても軽すぎてもいけないようなので、有意水準は5%として、両側検定をすることにします。両側検定というのは、統計量(今回はF値)が小さすぎても大きすぎても\( H_0 \)が棄却されるような検定のことです。
では、excelなり何なりを使って棄却域を求めてやります。ただし、場所Aから採れたオレンジの重さの自由度は9で、場所Bの方は19です。なので、自由度9、19のF分布から棄却域を求めることになります。
すると、大体0.27以下と2.8以上が棄却域になります。なので、F値を計算して0.27以下または2.8以上になれば帰無仮説\( H_0 \)は棄却されて、\( H_1 \)が採択されます。つまり、残念ながら母分散は等しいと言えないとなるわけですな。
母分散を無視してF値を計算できる
では、F値を計算していきます。一応F値の求め方を再掲しときます。必要なのはAとBそれぞれの標本に対する不偏分散と、それぞれの母集団に対する母分散です。
$$ F= \frac{ \frac{ s_A^2 } { \sigma_A^2 } } { \frac{ s_B^2 } { \sigma_B^2 } } $$
まずは不偏分散から。不偏分散\( s_A^2 \)と\( s_b^2 \)は、計算すると\( s_A^2 = 929.8 \)\( s_B^2 = 414.3 \)になります。
で、母分散も計算しましょうとなるところですが、今は\( \sigma_A^2 = \sigma_B^2 \)を仮説として立てています。つまり、\( \sigma_A^2 = \sigma_B^2 \)の下で計算を進めていかなければならなくなっています。ということで、その関係式をF値の公式に代入してやると母分散が消去されて、不偏分散だけの分数になります。つまり、次のように変形できるということです。母分散の添え字に注目して式を追いかけてみてください。
$$
\begin{equation}
\begin{split}
F &= \frac{ \frac{ s_A^2 } { \sigma_A^2 } } { \frac{ s_B^2 } { \sigma_B^2 } }
&= \frac{ \frac{ s_A^2 } { \sigma_B^2 } } { \frac{ s_B^2 } { \sigma_B^2 } }
&= \frac{ s_A^2 } { s_B^2 }
\end{split}
\end{equation}
$$
なので、この状態でF値を計算します。すると、\( F = 2.24 \)となります。F値は棄却域には入っていないので、有意水準5%で帰無仮説は棄却されないということになります。つまり、「まぁばらつき方は同じと言っても差し支えないんじゃない」ってことですな。
これでめでたくF検定ができましたとさ。めでたしめでたしということです。