どこまで信頼できるのかは分からんのですが、ネット上にあるIQテストを受けてみたんです。一応有料ではあったし、40問あったので、それなりに信頼はできるのでは?と思ってます。(まぁ、全部図形問題で、いくつか同じパターンの問題とか見たことのある問題とかも出てきたんで実際よりも高めの数値にはなってるでしょうが笑)
上のサイトにあったIQの説明を読んでると、どうもIQって根本にある理論とか考え方は偏差値と一緒なんじゃない?って思ったわけです。
ってことで、今回は偏差値って何なの?とか、偏差値の計算から色々と面白い理論につながったりするので、今回は偏差値計算の応用例を2つほど(長さの関係で概要だけですが)紹介します。
それでは、よろしくお願いします~。
偏差値は全体に対する位置を表す
偏差値って言葉を聞くのは、「○○高校の偏差値は59だから、偏差値が56の自分はもうちょっと勉強しといた方がいいな」みたいな場面かと思います。つまり、偏差値から自分がどの位置にいるのか、目標地点がどのくらいなのかってのを読み取ってるわけです。
偏差値は、一言で言うとデータが全体の中ではどれくらい高いのか(低いのか)を表した数値になります。偏差値を見るだけで目標がどこ、自分がどこってのが読み取れるのは、全体に対しての位置を教えてくれてるからってことですな。
本当に偏差値で評価しないとダメなの?って方もいるかと思うんで、その説明を。
例えば、ある試験で誰かが80点を取ったと言ったとしても、それだけではどう評価していいのか分かりません。仮に平均点が90点なら出来が悪いってことになりますし、平均点が70点であれば出来が良いってことになります。つまり、基準がないと比較できないってことですな。
基準が必要ってことの次に考えなくちゃならんのがばらつきの問題です。
平均点が70点だったとします。ほとんどの人(例えば95%の人)が65~75点のどれかを取ったテストで80点を取った人と、ほとんどの人が55~85点のどれかを取ったテストで80点を取った人を考えてみます。
どちらも同じように70点という基準があって、80点を取ったというのも変わらないのですが、1人目と2人目を同じように評価するとなんとなく問題がありそうです。1人目はほとんどの人には入っておらず、2人目ではほとんどの人に入ってるからです。1人目の方が2人目よりも良い成績のような気がしますよね。
ってことで、ある人がどれだけ出来ていたのかを周囲と比較したいってときに考えるべきは、1つ目に基準があるかどうか、2つ目にばらつきがどれくらいかっていう2つになります。
その2つをクリアした数値が偏差値になります。
偏差値の計算方法
偏差値の計算方法を見ていきます。xが得点(自分の得点とでもしておきましょうか)で、\( \overline{x} \)は全体の平均点、sは全体の標準偏差です。ここで言う全体を学年全体とすれば学年全体でどれくらいの位置にいるのかが分かりますし、全体を全国と解釈すれば全国ではどれくらいなのかが分かります。
$$ (偏差値) = 50 + 10 \times \frac{x – \overline{x}}{s} $$
数式自体はいたって簡単ですね。自分の点数から平均値を引いて、それを標準偏差で割ってから10をかけた数値を50に足せばいいだけです。そしたらめでたく偏差値とご対面です。
この計算をしてやると、平均が50、標準偏差が10の分布における点数が出てきます。
実際に上の2つの例で計算してみます。まずは平均70、標準偏差10の方から。得点は80点なので、\( \overline{x} \)は80になります。結果は60になります。計算式はこちら。
$$
\begin{equation*}
\begin{split}
\ (偏差値) &= 50 + 10 \times \frac{x – \overline{x}}{s} \\
&= 50 + 10 \times \frac{80 – 70}{10} \\
&=50 + 10 = 60
\end{split}
\end{equation*}
$$
次に、平均70、標準偏差20の方を。結果は55になります。
$$
\begin{equation*}
\begin{split}
\ (偏差値) &= 50 + 10 \times \frac{80 – 70}{20} \\
&=50 + 5 = 55
\end{split}
\end{equation*}
$$
平均値と得点が同じであっても標準偏差が違うと偏差値は違ってくるというのがお判りいただけるかと思います。
標準化という操作
特に標準偏差さえ計算できてしまえば、あとは難しい計算がありませんでした。しかし、統計学的には重要な計算が含まれていまして、
$$ \frac{x – \overline{x}}{s} $$
の部分です。この計算のことを標準化と呼びます。
標準化は一言で言うと、ある数値に対して基準とばらつき具合の加味とを同時にする操作になります。
上で、1人目の方が成績良さそうだよねーって予想をして、偏差値を比較したわけですが、偏差値の比較に意味があるのはこの標準化のおかげなのだってことですな。
で、この標準化のおかげで色んなことができるんですが、とりあえず下に挙げた二つだけ。
標準化の応用例
t検定で
ざっくりと言うと、t検定ってのはその名の通り検定の一種なんですけど、特に母分散が分からないときに使われる検定になります。取れたデータを標準化して、その標準化したデータを基に結論をはじき出そうってのがt検定になります。
まぁ、母分散が分かってるケースなんて極めて稀ですから、理論だけで終わらないで現実的に使える検定になりますね。
単回帰分析で
単回帰分析では、取れたデータを利用して、未知のデータを予測するわけですが、その際にy=ax+bという直線の式を利用するんですな。(x, y)っていうデータが大量にあって、xとyのあいだに相関があれば、y=ax+bって式の形に押し込めるんじゃないかと。
仮に降水確率が10%のときに事故が1件、20%なら2件、40%なら4件ってデータがあったら、30%はきっと3件だろう、50%ならきっと5件になるだろうって予想しますよね。それを数式の形で表してやろうってのが単回帰分析なわけです。
で、aとbをデータから導き出すんですが、ここで1つ問題がありまして、データが確率的に変わるものであるということは、そこから導かれるaとかbも確率的に変わるんじゃないかって問題が残ってるんです。それを解決するときに、今回説明した標準化が役に立つわけです。
標準化とかt検定、単回帰分析に興味があるよ~って方は下の2冊をおすすめしときます~。標準化とかt検定とかは上の本、単回帰分析は下の本をどうぞ~。
P.P.S. 僕のIQは127らしいのですが、高いのか低いのかよく分かりませんな~(それに、結局はパターンを見つけるだけだったので、40問中5、6問くらいは見たことある感じの問題でしたし)。人口全体の上位5%以内って言われると「なかなか高いんじゃない?」とも思うんですけど、逆に言えばIQが僕と同じかそれ以上の人が5%は存在してるわけで、人数に換算してやると結構多いんですな。中学校が40人のクラスなら、教室に2人くらいは居てるわけですから、学年全体、学校全体、日本全体、さらには世界全体って考えると、、う~ん。結局、IQってどう見たらいいのやら。とりあえず、なんか微妙な数値ですんません!