スポンサーリンク

標準偏差 ~範囲が知りたい!~

前回、標準偏差って何なんだ?ってことをお話ししました。ざっくりとまとめておくと、標準偏差ってのは、結局データがどの程度固まってるのか、逆に散らばってるのかを表した数値だよーって話でした。

今回は、もう少し掘り下げて、「じゃあ標準偏差ってどうすれば計算できるの?」「標準偏差はどうやって見ればいいの?」みたいな話をしていこうかと思います。

スポンサーリンク

標準偏差の計算方法

手順

最初に計算方法について書いときます。全部で5ステップです。

1、各データから平均値を引く
2、第1で求めた各数値をすべて2乗する
3、第2で求めた各数値を合計する
4、第3で求めた数値をデータの数で割る
5、第4で求めた数値の平方根を求める
 ※ちなみに、平均値は全部のデータを足してからデータの個数で割った値です。

具体例

上の計算方法だけじゃいまいちピンとこない方もいるかと思うので、ある都市に住む住民全員の身長から標準偏差を割り出そうって例で上の計算方法を実行していきたいと思います。それでは、やっていきましょー。

第1ステップ:データから平均値を引く

まず、ある都市の住民が10人で、169.4、171.2、178.9、156.4、165.7、169.8、174.9、166.4、181.2、167.8(単位は全部cm)だったとします。これが、仮に10人じゃなくて、10万人でも10億人でもやることは変わりません。とりあえずデータを用意してこのステップを実行していけば標準偏差が求まります。

※Excelをお持ちの方ならデータを打ち込んで STDEV.Pって関数を使えば、こんな計算をしなくても標準偏差は求まります(いきなり身も蓋もないことを言うやつ )。

では、第1ステップを実行していきましょう。平均値は計算すると170.1cmになるので、データは-0.77、1.03、8.73、・・・、-2.37ってなります。

ちなみに、この元データから平均値を引いた数値は偏差って呼ばれます。

第2ステップ:各数値を2乗する

次のステップは前ステップで求めた数値を2乗していくって作業です。計算すると、順番に0.5929、1.0609、76.2129、・・・、5.6169になります。

第3ステップ:合計を求める

全部を2乗できたら、その総合計を求めましょう。つまり、
0.5929 + 1.0609 + 76.2129 + ・・・ + 5.6169
を求めましょうってことですな。

で、求めてやると 451.461になります。

第4ステップ:データ数で割る

今回はデータ数が10個なので、先ほど求めた451.461を10で割って45.1461にしてやります。今回は10で割るので、小数点を動かせばいいだけなんで楽ですねー。

第5ステップ:平方根を求める

最後にさっき求めた45.1461の平方根を求めてやりましょう。

つまり、√45.1461を求めようってことですな。で、求めてやると大体6.72になります。もっとざっくりと捉えると6.7ですね。

で、標準偏差が分かって何が嬉しいの?

数字遊びをやったらこんな数字ができて楽しー!ワーイ!みたいな、訳の分からん暇つぶしみたいなことがやりたくて標準偏差を求めたわけではありません。ちゃんと意味があるから求めたわけなんです。じゃあ、標準偏差が分かったらメリットがあるのよ?ってのを説明します。

でそのメリットなんですが、「データのばらつき度合いが分かる」ってことです。データが総じて平均値の近くにあるのか、平均値から離れているのかが分かるんで、データの持ってる特徴が分かるんですな。

今回の例で説明してみましょう。今回、標準偏差は大体6.7でした。ここで、前回の話を思い出してもらうと、標準偏差の2倍と平均値の和、差を求めてやると、その範囲内に全データの95%が入るってことでした。

標準偏差の2倍を足したり引いたりして出てきた数値の間にデータの95%が入ってるってことです(今回の例なら9個か10個はその範囲内に入ってるってことです)。では、その範囲を求めてやりましょう。

まず標準偏差の2倍を求めておきますと、6.7の2倍なので13.4です。で、平均値が170.17だったので、これに標準偏差の2倍を足してみると、183.57になります。平均値から標準偏差の2倍を引くと、156.77になります。

このことから、データの内、95%が156.77から183.57という範囲の中にあるってことが分かるわけです。実際にデータを確認していただくと、10個の内、9個が確かにその範囲に入ってることが確認できるかと思います。ざっくりと言うと、この都市では、大体の人の身長が156.77cmから183.57cmの間に収まってるってことです。

個人個人の身長がどれくらい平均値辺りに固まってるのかを見たいだけなら計算しなくてもグラフを作るだけで十分なんですが、それだと人の考え方にかなり左右されちゃうので、根拠を持って議論したいってときにはこういう計算が便利なんですね。まぁ、それでも95%の人を大半とするのか、99%の人々でないと大半の人とみなせないのかってあたりは、また個人の考え方によって変わってきちゃうので何とも言えないところではあるんですが。

ってことで、標準偏差について、計算方法と具体例、その見方についてお話ししてきました。そろそろお出かけの時間になっちゃったので、今回はこの辺にしておきたいと思います。また次回、よろしくお願いしますー。ではではー。

タイトルとURLをコピーしました