統計学

t検定とは Excelでの分析方法や検定の特徴を分かりやすく解説

t検定とは

2つのグループの平均に差があるかどうかを帰無仮説と対立仮説をたてて、調べます。

t検定には3つの種類があります。

1つ目は、同じグループによるt検定。

2つ目は、違うグループで分散が等しいサンプルによるt検定。

3つ目は、違うグループで分散が異なるサンプルによるt検定(Welch法)。

分散が等しいかどうかはF検定を使用します。

t検定を行う方法

Excelの関数であるT.TEST関数を使用してt検定を行います。

これからT.TEST関数を使用して検定する3つの方法を説明します。

1つ目の方法は、セルに直接、関数を手入力する方法です。

例として、運動前と運動後の体重の平均に差があるかどうかについて、同じグループによるt検定で検定する方法を説明します。

  • 帰無仮説:運動前と運動後の体重の平均に差はない
  • 対立仮説:運動前と運動後の体重の平均に差はある

①セルにカーソルがある状態で、「=t」と入力すると、Tから始まる関数の一覧がプルダウンで表示されます。

②下矢印で「TEST」までフォーカスを移動させ、Tabキーを押します。

③TEST関数で比較するデータの入力待ち状態となります。

④セルの範囲選択を使用して、運動前の体重データを入力します。

⑤データを区切るため、「,」を入力します。

⑥セルの範囲選択を使用して、運動後の体重データを入力します。

⑦データを区切るため、「,」を入力します。

⑧検定の指定を行います。

「1」は片側検定、「2」は両側検定です。

今回は、差があるかどうかを求めるため、「2」を入力します。

⑨データを区切るため、「,」を入力します。

⑩検定の種類を選択します。

「1」は同じグループによるt検定、「2」は違うグループで分散が等しいサンプルによるt検定、「3」は違うグループで分散が異なるサンプルによるt検定(Welch法)です。

今回は、同じグループによるt検定のため、「1」を入力し、Enterを押します。

⑪t検定で判断に使用するP値が表示されます。

P値は「0.003392」です。

P値が0.05以下であれば、平均に差がないといわれています。

今回の結果は、0.05以下であるため、「運動前と運動後の体重の平均に差はない」と考えられます。

2つ目の方法は、関数を挿入する方法です。

例として、ある商品の性別による購入金額の平均に差があるかどうかについて、違うグループで分散が等しいサンプルによるt検定で検定する方法を説明します。

  • 帰無仮説:性別による購入金額の平均に差はない
  • 対立仮説:性別による購入金額の平均に差はある

①セルが選択されている状態で、fxボタンをクリックします。

②関数の挿入画面が表示されます。

③関数の検索欄に、「T」と入力し、検索開始(G)ボタンをクリックします。

④検索結果の関数名からTEST関数を選択し、OKボタンをクリックします。

⑤関数の引数画面が表示されます。

⑥配列1にセルの範囲選択を使用して、男性の購入金額のデータを入力します。

⑦配列2に女性の購入金額のデータを入力するため、範囲選択ボタンをクリックします。

⑧セルの範囲選択を使用して、女性の購入金額のデータを入力後、範囲選択ボタンをクリックします。

⑨検定の指定を行います。

「1」は片側検定、「2」は両側検定です。

今回は、差があるかどうかを求めるため、「2」を入力します。

⑨検定の種類を選択します。

「1」は同じグループによるt検定、「2」は違うグループで分散が等しいサンプルによるt検定、「3」は違うグループで分散が異なるサンプルによるt検定(Welch法)です。

今回は、違うグループで分散が等しいサンプルによるt検定のため、「2」を入力し、Enterを押します。

⑩t検定で判断に使用するP値が表示されます。

P値は「0.937358」です。

P値が0.05以下であれば、平均に差がないといわれています。

今回の結果は、0.05以上であるため、「性別による購入金額の平均に差はある」と考えられます。

3つ目の方法は、数式タブから関数を入力する方法です。

例として、ある商品の性別による購入金額の平均に差があるかどうかについて、違うグループで分散が異なるサンプルによるt検定(Welch法)で検定する方法を説明します。

  • 帰無仮説:性別による購入金額の平均に差はない
  • 対立仮説:性別による購入金額の平均に差はある

①セルが選択されている状態で、数式タブのその他の関数の中にある統計のTEST関数を選択します。

②関数の引数画面が表示されます。

③配列1にセルの範囲選択を使用して、男性の購入金額データを入力します。

④配列2に女性の購入金額データを入力するため、範囲選択ボタンをクリックします。

⑤セルの範囲選択を使用して、女性の購入金額データを入力後、範囲選択ボタンをクリックします。

⑥検定の指定を行います。

「1」は片側検定、「2」は両側検定です。

今回は、差があるかどうかを求めるため、「2」を入力します。

⑦検定の種類を選択します。

「1」は同じグループによるt検定、「2」は違うグループで分散が等しいサンプルによるt検定、「3」は違うグループで分散が異なるサンプルによるt検定(Welch法)です。

今回は、違うグループで分散が等しいサンプルによるt検定(Welch法)のため、「3」を入力し、Enterを押します。

⑧t検定で判断に使用するP値が表示されます。

P値は「0.936244」です。

P値が0.05以下であれば、平均に差がないといわれています。

今回の結果は、0.05以上であるため、「性別による購入金額の平均に差はある」と考えられます。

以上の3つの方法で、T.TEST関数によるT検定により、P値を求めることができます。

次に、Excelの分析ツールを使用して、t検定を行う方法を説明します。

Excelの分析ツールを使用して、t検定を行います。

分析ツールを使用する前に、Excelの分析ツールが使用できるように設定します。

①Excelを起動し、オプションをクリックします。

②アドインを選択して、管理(A):に「Excel アドイン」を設定し、設定(G) ...ボタンをクリックします。

③アドイン画面が表示されますので、分析ツールにチェックをつけ、OKボタンをクリックします。

④データタブをクリックし、データ分析が追加されていることを確認します。

データ分析が追加されていれば、データ分析ツールの準備は完了です。

Excelの分析ツールを使用した前述の3つのt検定の方法を説明します。

例として、運動前と運動後の体重の平均に差があるかどうかについて、同じグループによるt検定で検定する方法を説明します。

  • 帰無仮説:運動前と運動後の体重の平均に差はない
  • 対立仮説:運動前と運動後の体重の平均に差はある

①データタブからデータ分析をクリックします。

②データ分析画面が表示されますので、「t検定: 一対の標本による平均の検定」を選択し、OKボタンをクリックします。

③t検定: 一対の標本による平均の検定画面が表示されます。

項目名説明
変数1の入力範囲()比較するデータを範囲選択します。
変数2の入力範囲()比較するデータを範囲選択します。
仮説平均との差異(Y)2群の平均値にある特定の差を仮定する際に設定します。
ラベル(L)データの範囲を選択した際、先頭行の項目名も範囲選択した場合に、チェックを入れます。

チェックを入れ忘れた場合は、以下のようなエラーメッセージが表示されます。

α(A)有意水準を指定します。初期値は、「0.05」です。
出力先(O)同じシート内に検定結果を出力する場合に、チェックを入れます。

検定結果を出力する先頭行のセルを指定します。

新規ワークシート(P)検定結果を新しいワークシートに出力する場合に、チェックを入れます。
新規ブック(W)検定結果を新しいブックに出力する場合に、チェックを入れます。

④変数1の入力範囲にセルの範囲選択を使用して、運動前の体重データを入力します。

⑤変数2の入力範囲に運動後の体重データを入力するため、範囲選択ボタンをクリックします。

⑥セルの範囲選択を使用して、運動後の体重データを入力後、範囲選択ボタンをクリックします。

⑦条件を設定して、OKボタンをクリックします。

⑧t検定で判断に使用するP値が表示されます。

P値は「0.00339167」です。

P値が0.05以下であれば、平均に差がないといわれています。

今回の結果は、0.05以下であるため、「運動前と運動後の体重の平均に差はない」と考えられます。

例として、ある商品の性別による購入金額の平均に差があるかどうかについて、違うグループで分散が等しいサンプルによるt検定で検定する方法を説明します。

  • 帰無仮説:性別による購入金額の平均に差はない
  • 対立仮説:性別による購入金額の平均に差はある

①データタブからデータ分析をクリックします。

②データ分析画面が表示されますので、「t検定: 等分散を仮定した2標本による検定」を選択し、OKボタンをクリックします。

③t検定: 等分散を仮定した2標本による検定画面が表示されます。

項目名説明
変数1の入力範囲()比較するデータを範囲選択します。
変数2の入力範囲()比較するデータを範囲選択します。
仮説平均との差異(Y)2群の平均値にある特定の差を仮定する際に設定します。
ラベル(L)データの範囲を選択した際、先頭行の項目名も範囲選択した場合に、チェックを入れます。

チェックを入れ忘れた場合は、以下のようなエラーメッセージが表示されます。

α(A)有意水準を指定します。初期値は、「0.05」です。
出力先(O)同じシート内に検定結果を出力する場合に、チェックを入れます。

検定結果を出力する先頭行のセルを指定します。

新規ワークシート(P)検定結果を新しいワークシートに出力する場合に、チェックを入れます。
新規ブック(W)検定結果を新しいブックに出力する場合に、チェックを入れます。

④変数1の入力範囲にセルの範囲選択を使用して、男性の購入金額データを入力します。

⑤変数2の入力範囲に女性の購入金額データを入力するため、範囲選択ボタンをクリックします。

⑥セルの範囲選択を使用して、女性の購入金額データを入力後、範囲選択ボタンをクリックします。

⑦条件を設定して、OKボタンをクリックします。

⑧t検定で判断に使用するP値が表示されます。

P値は「0.937357791」です。

P値が0.05以下であれば、平均に差がないといわれています。

今回の結果は、0.05以上であるため、「性別による購入金額の平均に差はある」と考えられます。

例として、ある商品の性別による購入金額の平均に差があるかどうかについて、違うグループで分散が異なるサンプルによるt検定(Welch法)で検定する方法を説明します。

帰無仮説:性別による購入金額の平均に差はない

対立仮説:性別による購入金額の平均に差はある

①データタブからデータ分析をクリックします。

②データ分析画面が表示されますので、「t検定: 分散が等しくないと仮定した2標本による検定」を選択し、OKボタンをクリックします。

③t検定: 分散が等しくないと仮定した2標本による検定画面が表示されます。

項目名説明
変数1の入力範囲()比較するデータを範囲選択します。
変数2の入力範囲()比較するデータを範囲選択します。
二標本の平均値の差(H)2群の平均値にある特定の差を仮定する際に設定します。
ラベル(L)データの範囲を選択した際、先頭行の項目名も範囲選択した場合に、チェックを入れます。

チェックを入れ忘れた場合は、以下のようなエラーメッセージが表示されます。

α(A)有意水準を指定します。初期値は、「0.05」です。
出力先(O)同じシート内に検定結果を出力する場合に、チェックを入れます。

検定結果を出力する先頭行のセルを指定します。

新規ワークシート(P)検定結果を新しいワークシートに出力する場合に、チェックを入れます。
新規ブック(W)検定結果を新しいブックに出力する場合に、チェックを入れます。

④変数1の入力範囲にセルの範囲選択を使用して、男性の購入金額データを入力します。

⑤変数2の入力範囲に女性の購入金額データを入力するため、範囲選択ボタンをクリックします。

⑥セルの範囲選択を使用して、女性の購入金額データを入力後、範囲選択ボタンをクリックします。

⑦条件を設定して、OKボタンをクリックします。

⑧t検定で判断に使用するP値が表示されます。

P値は「0.936246468」です。

P値が0.05以下であれば、平均に差がないといわれています。

今回の結果は、0.05以上であるため、「性別による購入金額の平均に差はある」と考えられます。

以上で、Excelの分析ツールを使用した説明は終わりです。

まとめ

t検定は、よく使われる検定方法です。

t検定は3種類ありますが、それぞれの特徴を把握して、最適な方法でt検定を行いましょう。

[PR]※本サイトには、プロモーションが含まれています。

未経験の方にオススメのデータサイエンティスト養成スクール【厚生労働大臣指定講座】

おすすめポイント

  1. 専門実践訓練給付金対象で最大70%給付
  2. 学習面、転職面で、サポートが超手厚いので、挫折しにくい!
  3. 実践的なスキルを学べるので、即戦力になれる!

  • この記事を書いた人

にっしー

フリーランス2年目の29歳。 専門統計調査士など、統計に関する資格を複数保有。 自分が数学苦手だった文系だからこそ書ける、分かりやすい情報発信を心がけています。ヘビ飼育歴5年。 著書『これから学ぶ人のための統計学超入門』 寄稿実績:『知識ほぼゼロからデータ分析の専門家になる(週刊東洋経済)』、『50歳からの学び直し入門 (インターナショナル新書)』(一部)

~人気記事~

1

リスキリングの流れもあり、最近注目度が高まりつつあるデータサイエンス。 データサイエンスは独学で学ぶには少しハードルが高 ...

2

こんにちは!統計ブロガーのにっしーです! 今回は、統計学のキホンを学ぶのに最適な統計検定3級を爆速で取るための重要事項を ...

3

データサイエンススクールがオススメな理由 昨今、データサイエンスを学びたいという人が急増しています。 しかし、データサイ ...

4

こんにちは。統計ブロガーのにっしーです! 「統計学」というとみなさんはどのようなイメージがあるでしょうか。 なんだか少し ...

5

いきなりですが、皆さんは擬似相関という言葉をご存じでしょうか。 擬似相関は、”見せかけの相関”ともいわれる、うっかりして ...

-統計学