近年注目されている適合度検定。聞いたことはあるけれど「適合検定って何?検定の手順が分からない。ビジネスでどう活用すればいいか分からない。」
このような疑問を抱えている方は多いのではないでしょうか。
当記事ではこのような疑問を解決します。
適合度検定はカテゴリデータ比率と理論上の比率とで差が無いか検証できる非常に便利な検定です。当記事で適合度検定について理解を深めましょう。
適合度の検定とは
適合度検定の概要
適合度検定とは、実際のデータ値の比率が理論上の比率と一致しているか確認する統計の方法です。
たとえば、日本人の血液型比率は理論上でA型4割、B型2割、AB型1割、O型3割と言われますが、無作為で選んだ被験者の比率がA型3割、B型3割、AB型2割、O型2割だったとします。
この時、理論上の比率と実際に集まった被験者の比率が違います。
この比率の差が偶然であれば問題ありませんが、偶然でない場合は被験者の選定方法を考え直す必要があります。
また、理論上の数値は確率的に予測される数値のため「期待度数」、実際に測定した値は「観測度数」と呼ばれることがあります。
使える条件
適合度検定を利用するには、「データが比率で表せること」と「データの理論上の比率が明確であること」の2つの条件が揃っている必要があります。
一方、身長や体重などの数値が連続するデータなどの比率で表せられないものや、理論上の比率が明確でないものは適合度検定が利用できません。
上記の概要で説明したように、適合度検定では実測値の比率と理論上の比率の差を確認するため、もし連続する値で検定したい場合は、体重10㎏ごとに分類し比率にする必要があります。
このように適合度検定では、ある事象が発生するか分布を仮に定め、そこから理論値を計算し実測値との差を検証します。もし2つの数値に差がある場合は、仮に定めた分布が実際の数値に適合していないと判断します。
適合度検定とは?カイ二乗検定を使う理由や独立性の検定との違いを解説!|いちばんやさしい、医療統計 (best-biostatistics.com)
25-4. 適合度の検定 | 統計学の時間 | 統計WEB (bellcurve.jp)
適合度検定と独立性の検定違い
「適合度検定」と比較されるものとして「独立性の検定」があります。
この2種類の検定は、検証したい目的が違います。
「適合度検定」では、先ほど解説した様に実際に測定したデータの比率が理論上の比率と一致しているか検証するために使われましたが、「独立性の検定」では、2つの異なる群の比率が一致しているか検証するために使われます。
また、使う際のカイ二乗検定の計算方法での理論値の決定方法も異なり、「適合度検定」の理論値は事前に設定した値ですが、「独立性の検定」の理論値は2つの群が一致していると仮定した際の値としています。
統計量の求め方が似ていたり、2種類ともカイ二乗を利用したりするため、混乱してしまうかも知れませんが、検定使用時は何を仮定にしているのか目的を明確にし、適した検定方法の選定をしましょう。
適合度検定の手順
今回も「日本人の血液型の比率」を例に解説します。
実際に適合度検定を行う流れは以下の手順です。
- 事前準備
- クロス集計表の作成
- カイ二乗検定の実行
それぞれ解説します。
事前準備
ある研究のためにランダムに100人選び、集まったデータの血液型比率のバランスを検証する目的とします。
事前準備では、以下3つの点を意識することが大切です。
何の比率を検証したいのか
検証したい比率(目的)を明確にします。
【例】集めた人の血液型比率の検証がしたい
理論上の比率は明確か
目的に応じた理論上に比率を調べます。
【例】A型4割、B型2割、AB型1割、O型3割
有意水準の設定をどうするか
一般的に有意水準は5%に設定されることが多いです。
簡単にいうと、「5%以下の確率で起こることは、100回のうち5回以下という確立になるため、このような場合は、起こった事象が偶然ではなく必然的に起こっている事象と判断する」という意味です。
【例】慣例に従い有意水準は5%とします。
クロス集計表の作成
集まった被験者を血液型で分類したところ
- A型:55人
- B型:16人
- AB型:7人
- O型:22人
だったとします。
この実測データと理論値を利用しExcelでクロス集計表を作成します。
カイ二乗検定の実行
作成したクロス集計表を利用しカイ二乗検定を行います。
適合度検定で使うExcelの関数は「CHISO.TEST関数」です。
【計算手順】
- 何も記載されていないマスに「TEST(実測値,期待値)」を入力する
- Enterキーでp値を算出する
計算手順はこの2つのみです。
カイ二乗検定で求めた結果(p値)が有意水準の5%より低い場合、集めた被験者の血液型比率に偏りがあることになり、被験者100人の集め方を考え直す必要があります。
また、P値は小さければ小さいほど発生する可能性が高いということになり、検証結果は偶然ではなく必然的である可能性が高いとなります。
適合度検定とは?カイ二乗検定を使う理由や独立性の検定との違いを解説!|いちばんやさしい、医療統計 (best-biostatistics.com)
ビジネスにおける活用場面
商品の不正調査
ここでは、商品を「サイコロ」とします。
サイコロが不正に作られているか調査するために60回サイコロを振り、出た目を集計します。
また、有意水準は5%での検定であり、正しく作られたサイコロであれば1~6の目が出る回数は全て等しくなるはずなので、理論上の比率は全ての目が10回ずつ出る事とします。
サイコロを60回振った結果が以下のようになったとします。
【結果】
- 1の目:9回
- 2の目:10回
- 3の目:12回
- 4の目:8回
- 5の目:10回
- 6の目:11回
この様にバラつきがあった場合にクロス集計表を用いてp値を求めれば、p値が0.05より低くなればサイコロは不正に作られたことが分かります。
今回はサイコロを例としましたが、理論比率が分かっていれば製品の不正だけでなく、設備仕様や工程など、発生している部分の検証もすることができます。
練習問題(25. さまざまな検定) | 統計学の時間 | 統計WEB (bellcurve.jp)
カイ二乗検定 - ナンバーズ予想で学ぶ統計学 (codereading.com)
まとめ
ここまで適合度検定の概要、独立性の検定との違い、検定手順、ビジネスでの活用事例について詳しく解説してきました。
近年では統計学を利用した「適合度検定」を品質管理などの仕事で実際に活用している企業がある中、利用方法が分からず導入できていない企業も少なくありません。
適合度検定を正しく活用するには、まずは理解することが大切になります。
この記事で理解を深め、今後ビジネスで活用する際の参考にしていただけますと幸いです。