スポンサーリンク

統計学の種類 ~色んな個性があるんダヨー~

さて、一口に統計学と言っても色んな種類の統計学があるわけです。で、問題にぶつかったとき、どんな題名の本を読んだら良いのかが分からなくなったり、新しい本を読むとき最初にどんなことが書いてあるか分からなくて、心構えができずに速攻で挫折することになったり、色々と困ることがあるんですな。

ってなわけで、今回は色んな統計学をまとめてみました。ではでは、さっそく参りましょー。

スポンサーリンク

統計学 → 「記述統計」「数理統計」

大概のことは、まず2つに分けるんですが、統計学ってやつもご多分に漏れず、まず2つに分かれます。その2つが記述統計学ってやつと数理統計学ってやつです。

記述統計学

記述統計学ってのは、その名の通り記述するための統計学です。データをまとめて表にしたりグラフにしたりってことをする分野が記述統計学っていう風に呼ばれてます。「Yes No」の2択で聞いた質問の調査結果を示すには円グラフを使ったり、一定期間ごとの数値の移り変わりには折れ線グラフを使ったり、ってなことをするのが記述統計学と呼ばれてるってわけです。ノウハウ集に近いものがありますな。

数理統計学

数理統計学ってのは、数式を使って論理的に展開していく分野に使われてる呼び名です。コンビニの売れ筋商品を区別したり、陳列場所によって売り上げがどう変わるかとかを分析したり、テレビの視聴率を割り出したり、もっと応用が進んでいくとAIとか機械学習とかにも関わってきたりって分野のことです。

要するに、統計学と言われると、何となく数式がごちゃごちゃしててとかをイメージするかと思うんですが、そういう数式ごちゃちゃ、論理がちゃがちゃってのが数理統計だってことです。

結局

つまり、まずは人にバシッと良く見せられればいいのか、それとも数式とか論理でガチガチの議論を展開していきたいのかで二分されるわけですな。ひとまずは分かりやすい区分でいいですなー。

数理統計 → 「多変量解析」「推測統計」

記述統計はもう分かれなくって、数理統計が2つに分かれます。それが「多変量解析」と「推測統計」とです。

多変量解析

多変量解析ってのは、ざっくりと言うと大量のデータを相手にする分野です。色んな条件からデータを分類したいとか、相手にするデータ量を現実的な量に減らしたいとかいうときに出てくる統計学です。未評価のワインの評価を予測したいとなったときに、「土壌の質」「年間降雨量」「湿度」「ブドウの大きさ」「収穫時期」などなど色々な項目が関係していそうだけど、どんな項目をどれくらい考慮すれば評価できるの?って問題を解決する、つまり、ワインを開ける前に質を知るってときに活躍するのが多変量解析ということです。

推測統計学

推測統計学ってのは、何かの起こる可能性を議論する分野です。テレビの視聴率を割り出したり、当選確実をはじき出したり、診断結果からガンにかかってる確率を計算したりってことをする分野が推測統計学ってことです。

結局

つまり、関係は大量に考えられるけど、結局どの項目をどれくらい考えたらいいのよ?って疑問を解決したいのか、全体としてはどう?それが起こる確率ってどれくらいなのよ?って疑問を解決したいのかで多変量解析と推測統計に分かれるわけですね。こちらは読んで字のごとくで分かりやすいですねー。

推測統計 → 「頻度論」「ベイズ論」

最後に、推測統計学が「頻度論」と「ベイズ論」の2つに分かれて分類完了であります。

頻度論

頻度論ってのは、一部分を見ることで全体を予想したり、統計的な判断が本当に正しいのかどうかを考察したりする分野です。テレビ番組の視聴率を一部の家の視聴データから割り出すとか、まだ一部の票しか分かってないのに当選確実を出したりとかを担当してるのがこの分野です。大量生産品がちゃんと規格通りに作られてるかを確かめたりするのもこの分野です。

中学校とかで習った赤玉である確率がどうこう、引いたカードがハートである確率がどうこうってのもこの分野に入ります。

※大量生産品ってのは、機械で自動的に作られてるんですけど、機械もまったく完璧に同じものを作り続けられるわけじゃなくて、ときどき無視できないほどの誤差が出たりするんですな。それで、大量生産品がちゃんと同じものを作り続けられてるかどうかを確かめてやる必要があるわけです。でも、すべてを検査するのは時間と費用の問題からできなかったり、製品の性質上どうしてもできなかったりするので、頻度論の考え方を応用して、一部を検査するだけで全体が正確に仕上がっていると保証したりするんですな。

ベイズ論

ベイズ論ってのは、同じ推測統計学の中に入れられてるからには、頻度論の親戚みたいなもので、頻度論の中にある理論を別の視点から見ることで有用な結論を導き出した分野です。どんなことをする分野化というと、複数の確率が分かっている条件下で、ある現象が起こる確率がどれくらいかをたたき出すってことをする分野です。例えば、陽性と出たガンの検査結果とそもそもガンになる確率という2つの条件からその人が本当にガンである確率をはじき出すってことをできるのがこの分野です。

結局

つまり、一部分から全体を知りたいのか、複数の条件下での確率を知りたいのかによって頻度論とベイズ論に分かれるってことです。先に分かってるのがデータなのか、確率なのかって違いで分かれるってことですね。

終わりに

全体をまとめると、

統計学→「記述統計」「数理統計」(グラフとか表にするのかゴリゴリ計算するのか)
数理統計→「多変量解析」「推測統計」(色んな項目があるのか確率を知りたいのか)
推測統計→「頻度論」「ベイズ論」(データが先か確率の分かってる条件が先か)

っていう風に分かれてるってことですな。

多変量解析の中で頻度論が持ち出されるみたいなこともあるんで、完全にスパッと線引きができるわけじゃないんですけど、何となくの参考程度にはなるかと。これがとりあえず分かってれば、書店とか図書館に行ったとき、「多変量解析」とか「統計解析」とか「数理統計」とかとか、色んな中からお目当ての物が見つけやすくなるのではないでしょうか。Amazonでの検索もしやすくなるでしょうし。まぁ、お好きにお使いくださいってことで(最後の締めがめっちゃテキトー笑)。ではでは、またお会いしましょー。

タイトルとURLをコピーしました