スポンサーリンク

データと判断は分けなさいよーって論文 ~”賢明な”判断を求めて~

再び論文の解説です。今回の論文はE.H.Simpsonによるもので、『The Interpretation of Interaction in Contingency Tables』という題の論文です。日本語に訳せば、『分割表における交互作用の解釈』という感じになりましょう。

内容としては、前回記事に書いた「複数の分割表を足し合わせると妙なことが起こる」っていうものと似たようなところがありました。

タイトル通り、分割表のデータに対してどのような解釈を与えるのがいいのだろうか?というのがメインテーマになっていました。まず、ざっくりとした結論から述べておきますと、「数字だけから機械的に判断していると、間違った結論を導く可能性があるから、データを分析する際には数字を見るだけではいけませんよ」ということが書かれていました。

というわけで、論文の紹介へと移りたいところですが、一応その前に用語の説明へと洒落込んでおきます。

スポンサーリンク

分割表、交互作用とは?

論文タイトルにある「分割表」「交互作用」って言葉を知らない人のために説明しておきますと、

分割表ってのは前回記事の中でも書きましたが、複数の条件に対応した度数(データ数)を表形式でまとめたものになります。読み進めていただければどんなものかは分かるかと思います。

交互作用というのは、いわゆる相互作用のことです。なぜ、「相互」じゃなくて「交互」なのかは分かりません(もし知ってる人がいたらTwitterとかお問い合わせとかから教えていただけるとありがたいです)。

交互作用のイメージとしては、食材の食べ合わせなんかを想像してもらえれば良いかと思います。

サンマと漬物は同時に食べると発がん性物質が生成されてしまって、人体に有害なものになってしまいます。本来、サンマも漬物も組み合わせなければ人体には無害なものだったのに、組み合わせてしまったことで人体に有害なものになってしまったわけです。

この例みたいに、単体ではある程度の影響しかない(もしくは、食べ合わせの例のようにまったく影響がない)けど、組み合わせるとそれぞれの影響をただ足した以上の影響が確認される現象のことを交互作用と言います。

食べ合わせの場合は、組み合わせなければ「人体への害は確認されない」、組み合わせると「人体への害が確認される」ということで、交互作用があるということになります。

他の例えなら、アニメや映画なんかの音楽とシナリオの交互作用なんかが考えられます(実際に統計が取られているのかどうかは知りませんが)。

もしも、音楽とシナリオそれぞれの単体の感動以上に感動したら、音楽とシナリオを組み合わせなければ「そこそこの感動」、音楽とシナリオを組み合わせれば「大きい感動」という感じで、交互作用があるということになります。

スポンサーリンク

というわけで、本命の論文解説に移ります。

こんな分割表を想定します

シンプソンは論文の中で次のような思考実験を行っています。

ある調査員が次のような疑問を持ったとします。

「ジョーカーを除いたトランプ1組の赤と黒で数札と絵札の割合は変わるのだろうか?」

当然、この答えは「No」つまり、「赤と黒で数札と絵札の割合は変わらない」というのが正しい答えのはずです。つまり、赤では数札が24枚で絵札が2枚なのに対して、黒では数札が10枚で絵札が16枚みたいなことは無いってのが正しい答えってことですな。

※ジョーカーを除いたデッキ1組:1~10が数札、11~13が絵札

ただし、その調査員が調べたカードは幼児の遊んだもので、一部のカードが汚れていました。その汚れを見た調査員は、もしかしたらこの汚れも数札と絵札の割合に関係しているかもしれないと考えて、汚れているかどうかと数札と絵札の割合も調べることにしました。

そして、調査の結果、調査員は次の表1のような結果を得たとします。

この表1の上と下の数字を見比べてみてください。例えば、汚れありの絵札のカードを比較した場合、赤の方が数字が大きく黒の方が数字が小さいということが読み取れます。他の欄も同じようにして数字の大小関係を読み取れます。

数字だけから判断すると、色と絵札(数札)の数には関係がありそうです。

しかし先ほども確認した通り、実際には色と絵札(数札)の間に相関はありません。つまり、本来は次の表2のようにして考えなければならないということです。

では、どんな状況下でも必ず複数の表を併合して数字を見ればいいのかと言えばそうとも言い切れません。というのが、次の節です。

ラベルを変えてみると・・・?

先ほどの表1は、本来は汚れありと汚れなしの2つの表を足し合わせて一つの分割表にした上で結論を出さなければなりませんでした。

では、どんなものでも2つの表を足し合わせて判断するのが正しいのかというと、そうも言いきれません。次の表3のような状況を考えてみます。この表3は、ある病気に対して、処置をした場合としない場合、それと性別によって生存者数が変わるのかどうかを調べた表になります。生というのが生存者の割合、死というのが死亡者の割合を表しています。

この表3の数字は表1とまったく同じです。つまり、表3は表1の各ラベルの名前を変えただけの表ということになります。なので、数字だけを見れば表1のときとまったく同じ考察ができることになります。

つまり、性別ごとに分けた状態の表からは、生存者数が増えそうだと考えられて、男性と女性の表を足し合わせた表からは、処置と生死の間には関係がなさそうだということが言えることになります。

ここで、シンプソンは論文の中で次のように述べています。

果たして何が”賢明な”解釈なのだろう?その処置を男性に適用したとき、また女性に適用したときに有益であれば、その処置が人類に無益な処置であると拒否されることはほとんどない。

E.H.Simpson(1951)

ここで、正しい判断をするためには、男女それぞれのデータを足した表ではなく男女別に分けられた表(表3そのもの)であるということになります。つまり、まったく同じデータであっても、判断材料として使うべき表が変わってくるということですな。

表3の場合、単純に処置をしない女性の割合が多くて、処置をしない女性の生存者と死亡者の割合が大体一緒だったから、データを足し合わせると他の欄の差が目立たなくなってしまったという風な考察もできるかと思います。

なので、もし表3のようなデータが得られた後に追試験を使用となった場合、被験者数をもっと増やして、かつそれぞれの欄の割合が大体同じようになるように追試験を考えるべきでしょうな。

まとめ

というわけで、数字の処理は機械的にできても、解釈の引き出しは機械的にはできないという論文でした。

データ分析で結論を導き出すときには、数字を見るだけではなくて、必ず他のデータや状況も考慮しないといけないという教訓が得られるでしょうな。

タイトルとURLをコピーしました