今回は、同じデータの分析なのに、分析結果が逆転してしまう不思議な例である「シンプソンのパラドックス」をご紹介していきます。
シンプソンのパラドックスとは?
シンプソンのパラドックスとは、1951年にE.H.シンプソンによって発表されたパラドックス(逆説)のことです。
具体的には、母集団と、母集団を分割した集団とでは、特徴や傾向が逆転してしまうことを指します。
なかなか言葉だけでは伝わりにくいと思いますので、具体例で考えてみましょう。
シンプソンのパラドックス(具体例)
とある高校で英語のテストを実施しました。
1組と2組の男女別の平均点を出すと、以下の通りになりました。
1組
- 男子:3名が10点 平均点10点
- 女子:1名が5点 平均点5点
2組
- 男子:1名が20点 平均点20点
- 女子:7名が15点 平均点15点
だったとします。
この結果をみると、
1組も2組も、どちらも男子の方が女子よりも平均点が高いということになります。
では、1組と2組の結果を合算したらどうなるでしょうか。
計算すると、以下の通りになります。
1組&2組
- 男子:1名が20点、3名が10点 平均点12.5点
- 女子:1名が5点、7名が15点 平均点13.75点
なんと、どちらのクラスも男子の方が平均点が高かったにもかかわらず、
全体で見ると女子の方が平均点が高いという結果になりました。
これが、母集団(1組&2組)と母手段を分割した集団(1組、2組)で結果が異なるということです。
シンプソンのパラドックスに関しては以下の記事が凄く丁寧に書かれているのでオススメです。
↓この記事を読んだ方の多くは、以下の記事も読んでいます。