統計学

Excelでカイ二乗検定を行う方法を徹底解説

カイ二乗検定とは

2つの出来事に関連性があるのかどうかを調べます。

帰無仮説と対立仮説をたて、帰無仮説が起こる確率を計算します。

帰無仮説が起こる確率により、2つの出来事に関連性があるかどうかを調べます。

カイ二乗検定を行う方法

実測値と期待値を使用して、カイ二乗検定を行います。

例として、虫が好きか嫌いかという結果に性別が関連しているかどうかを調べます。

まずはそれぞれの期待値を求めます。

①男性で虫が好きな方の期待値を計算します。

B9のセルに、「=B5*D3/D5」と入力し、Enterキーを押します。

②男性で虫が嫌いな方の期待値を計算します。

C9のセルに、「=C5*D3/D5」と入力し、Enterキーを押します。

③女性で虫が好きな方の期待値を計算します。

B10のセルに、「=B5*D4/D5」と入力し、Enterキーを押します。

④女性で虫が嫌いな方の期待値を計算します。

C10のセルに、「=C5*D4/D5」と入力し、Enterキーを押します。

⑤虫が好きな方の合計を求めます。

B11のセルに、「=SUM(B9:B10)」と入力し、Enterキーを押します。

⑥虫が嫌いな方の合計を求めます。

C11のセルに、「=SUM(C9:C10)」と入力し、Enterキーを押します。

⑦男性の合計を求めます。

D9のセルに、「=SUM(B9:C9)」と入力し、Enterキーを押します。

⑧女性の合計を求めます。

D10のセルに、「=SUM(B10:C10)」と入力し、Enterキーを押します。

⑨総合計を求めます。

D11のセルに、「=SUM(D9:D10)」と入力し、Enterキーを押します。

ここから帰無仮説が起こる確率を求めるために使用されるExcel関数である「CHISQ.TEST」を使用する3つの方法を説明します。

1つ目の方法は、セルに直接、関数を手入力する方法です。

①セルにカーソルがある状態で、「=chi」と入力すると、CHIから始まる関数の一覧がプルダウンで表示されます。

②下矢印で「CHISQ.TEST」までフォーカスを移動させ、Tabキーを押します。

③CHISQ.TEST関数で計算したいデータの入力待ち状態となります。

④セルの範囲選択を使用して、実測値のデータを入力します。

⑤データを区切るため、「,」を入力します。

⑥セルの範囲選択を使用して、期待値のデータを入力し、Enterキーを押します。

⑦帰無仮説が起こる確率が表示されます。

2つ目の方法は、関数を挿入する方法です。

①セルが選択されている状態で、fxボタンをクリックします。

②関数の挿入画面が表示されます。

③関数の検索欄に、「CHI」と入力し、検索開始(G)ボタンをクリックします。

④検索結果の関数名からTEST関数を選択し、OKボタンをクリックします。

⑤関数の引数画面が表示されます。

⑥実測値範囲にセルの範囲選択を使用して、実測値のデータを入力します。

⑦期待値範囲に期待値のデータを入力するため、範囲選択ボタンをクリックします。

⑧セルの範囲選択を使用して、期待値のデータを入力後、範囲選択ボタンをクリックします。

⑨OKボタンをクリックします。

⑩帰無仮説が起こる確率が表示されます。

3つ目の方法は、数式タブから関数を入力する方法です。

①セルが選択されている状態で、数式タブのその他の関数の中にある統計のTEST関数を選択します。

②関数の引数画面が表示されます。

③実測値範囲にセルの範囲選択を使用して、実測値のデータを入力します。

④期待値範囲に期待値のデータを入力するため、範囲選択ボタンをクリックします。

⑤セルの範囲選択を使用して、期待値のデータを入力後、範囲選択ボタンをクリックします。

⑥OKボタンをクリックします。

⑦帰無仮説が起こる確率が表示されます。

以上の3つの方法で、CHISQ.TEST関数による帰無仮説が起こる確率を求めることができます。

帰無仮説が起こる確率は「0.000726」です。

0.05以下であれば、帰無仮説で仮定した事象はめったに起こらないといわれています。

今回の結果は、0.05以下であるため、「虫が好きか嫌いかという結果に性別が関連していない」という事象が起こる確率は低いということになり、結論としては、「虫が好きか嫌いかという結果に性別が関連する」ということになります。

まとめ

カイ二乗検定は、独立性の検定とも言われます。

独立とは、「何かに依存していない」「何かに関連していない」ということです。

カイ二乗検定は、「2つの変数間で関連していない」ことを証明します。

帰無仮説と対立仮説をたてて、それを証明していくプロセスは、とても楽しいと思います。

みなさんもいろいろなものの関連性を調べてみましょう。

思わぬ関連性が発見できるかもしれません。

何も考えずにこれまで見てきたデータもいろいろな分析方法を駆使して、分析を行えば、新たな一面を発見することがきっとできます。

最初は難しいかもしれませんが、いろいろなデータを使用して、データ分析を行ってみてください。

今回は、カイ二乗検定を説明しましたが、他にもいろいろな検定があります。

F検定、T検定、Z検定もExcelで検定を行うことができます。

また別の記事で、F検定、T検定、Z検定をExcelで検定する方法を説明します。

お楽しみにしてください。

エクセルでのカイ二乗検定のやり方|Office Hack (office-hack.com)

[PR]※本サイトには、プロモーションが含まれています。

未経験の方にオススメのデータサイエンティスト養成スクール【厚生労働大臣指定講座】

おすすめポイント

  1. 専門実践訓練給付金対象で最大70%給付
  2. 学習面、転職面で、サポートが超手厚いので、挫折しにくい!
  3. 実践的なスキルを学べるので、即戦力になれる!

  • この記事を書いた人

にっしー

フリーランス2年目の29歳。 専門統計調査士など、統計に関する資格を複数保有。 自分が数学苦手だった文系だからこそ書ける、分かりやすい情報発信を心がけています。ヘビ飼育歴5年。 著書『これから学ぶ人のための統計学超入門』 寄稿実績:『知識ほぼゼロからデータ分析の専門家になる(週刊東洋経済)』、『50歳からの学び直し入門 (インターナショナル新書)』(一部)

~人気記事~

1

リスキリングの流れもあり、最近注目度が高まりつつあるデータサイエンス。 データサイエンスは独学で学ぶには少しハードルが高 ...

2

こんにちは!統計ブロガーのにっしーです! 今回は、統計学のキホンを学ぶのに最適な統計検定3級を爆速で取るための重要事項を ...

3

データサイエンススクールがオススメな理由 昨今、データサイエンスを学びたいという人が急増しています。 しかし、データサイ ...

4

こんにちは。統計ブロガーのにっしーです! 「統計学」というとみなさんはどのようなイメージがあるでしょうか。 なんだか少し ...

5

いきなりですが、皆さんは擬似相関という言葉をご存じでしょうか。 擬似相関は、”見せかけの相関”ともいわれる、うっかりして ...

-統計学