カイ二乗検定とは
2つの出来事に関連性があるのかどうかを調べます。
帰無仮説と対立仮説をたて、帰無仮説が起こる確率を計算します。
帰無仮説が起こる確率により、2つの出来事に関連性があるかどうかを調べます。
カイ二乗検定を行う方法
実測値と期待値を使用して、カイ二乗検定を行います。
例として、虫が好きか嫌いかという結果に性別が関連しているかどうかを調べます。
まずはそれぞれの期待値を求めます。
①男性で虫が好きな方の期待値を計算します。
B9のセルに、「=B5*D3/D5」と入力し、Enterキーを押します。
②男性で虫が嫌いな方の期待値を計算します。
C9のセルに、「=C5*D3/D5」と入力し、Enterキーを押します。
③女性で虫が好きな方の期待値を計算します。
B10のセルに、「=B5*D4/D5」と入力し、Enterキーを押します。
④女性で虫が嫌いな方の期待値を計算します。
C10のセルに、「=C5*D4/D5」と入力し、Enterキーを押します。
⑤虫が好きな方の合計を求めます。
B11のセルに、「=SUM(B9:B10)」と入力し、Enterキーを押します。
⑥虫が嫌いな方の合計を求めます。
C11のセルに、「=SUM(C9:C10)」と入力し、Enterキーを押します。
⑦男性の合計を求めます。
D9のセルに、「=SUM(B9:C9)」と入力し、Enterキーを押します。
⑧女性の合計を求めます。
D10のセルに、「=SUM(B10:C10)」と入力し、Enterキーを押します。
⑨総合計を求めます。
D11のセルに、「=SUM(D9:D10)」と入力し、Enterキーを押します。
ここから帰無仮説が起こる確率を求めるために使用されるExcel関数である「CHISQ.TEST」を使用する3つの方法を説明します。
1つ目の方法は、セルに直接、関数を手入力する方法です。
①セルにカーソルがある状態で、「=chi」と入力すると、CHIから始まる関数の一覧がプルダウンで表示されます。
②下矢印で「CHISQ.TEST」までフォーカスを移動させ、Tabキーを押します。
③CHISQ.TEST関数で計算したいデータの入力待ち状態となります。
④セルの範囲選択を使用して、実測値のデータを入力します。
⑤データを区切るため、「,」を入力します。
⑥セルの範囲選択を使用して、期待値のデータを入力し、Enterキーを押します。
⑦帰無仮説が起こる確率が表示されます。
2つ目の方法は、関数を挿入する方法です。
①セルが選択されている状態で、fxボタンをクリックします。
②関数の挿入画面が表示されます。
③関数の検索欄に、「CHI」と入力し、検索開始(G)ボタンをクリックします。
④検索結果の関数名からTEST関数を選択し、OKボタンをクリックします。
⑤関数の引数画面が表示されます。
⑥実測値範囲にセルの範囲選択を使用して、実測値のデータを入力します。
⑦期待値範囲に期待値のデータを入力するため、範囲選択ボタンをクリックします。
⑧セルの範囲選択を使用して、期待値のデータを入力後、範囲選択ボタンをクリックします。
⑨OKボタンをクリックします。
⑩帰無仮説が起こる確率が表示されます。
3つ目の方法は、数式タブから関数を入力する方法です。
①セルが選択されている状態で、数式タブのその他の関数の中にある統計のTEST関数を選択します。
②関数の引数画面が表示されます。
③実測値範囲にセルの範囲選択を使用して、実測値のデータを入力します。
④期待値範囲に期待値のデータを入力するため、範囲選択ボタンをクリックします。
⑤セルの範囲選択を使用して、期待値のデータを入力後、範囲選択ボタンをクリックします。
⑥OKボタンをクリックします。
⑦帰無仮説が起こる確率が表示されます。
以上の3つの方法で、CHISQ.TEST関数による帰無仮説が起こる確率を求めることができます。
帰無仮説が起こる確率は「0.000726」です。
0.05以下であれば、帰無仮説で仮定した事象はめったに起こらないといわれています。
今回の結果は、0.05以下であるため、「虫が好きか嫌いかという結果に性別が関連していない」という事象が起こる確率は低いということになり、結論としては、「虫が好きか嫌いかという結果に性別が関連する」ということになります。
まとめ
カイ二乗検定は、独立性の検定とも言われます。
独立とは、「何かに依存していない」「何かに関連していない」ということです。
カイ二乗検定は、「2つの変数間で関連していない」ことを証明します。
帰無仮説と対立仮説をたてて、それを証明していくプロセスは、とても楽しいと思います。
みなさんもいろいろなものの関連性を調べてみましょう。
思わぬ関連性が発見できるかもしれません。
何も考えずにこれまで見てきたデータもいろいろな分析方法を駆使して、分析を行えば、新たな一面を発見することがきっとできます。
最初は難しいかもしれませんが、いろいろなデータを使用して、データ分析を行ってみてください。
今回は、カイ二乗検定を説明しましたが、他にもいろいろな検定があります。
F検定、T検定、Z検定もExcelで検定を行うことができます。
また別の記事で、F検定、T検定、Z検定をExcelで検定する方法を説明します。
お楽しみにしてください。