
今回は「t検定」についてご紹介していきます。
仮説検定にはいろいろな種類がありますが、そのなかでもt検定は統計解析で最も頻繁に使われると言っても過言ではない手法です。
検定を学ぶ基本にもなりますので、是非最後まで読んでみてください!
この記事を読むと分かること
- t検定とは
- 具体的なt検定の手順
- t検定の種類と活用事例

是非最後まで楽しんで読んでいただけますと幸いです!
もくじ
t検定とは
t検定とは、検定統計量が「t分布」と呼ばれる分布に従うことを利用して行われる検定方法です。
t分布は「自由度」と呼ばれるデータが自由に取れる数によって分布の形が変わるのですが、自由度が大きくなると正規分布に近づいていくことが知られています。
この図からも、自由度が上がっていくとどんどん正規分布に近づいていることが分かりますよね。
このような性質から、t検定は正規分布に従っていることを利用して行われるz検定と非常に密接な関係にあります!
母平均に対する検定
t検定もz検定も、どちらも母平均に対して明らかにしたいことがある時に用いられる検定方法です。
例えば、ある工場で作られている部品の重さが15gとなっているのか、それとも誤差とは言い切れない範囲で15gより重くなっているのかどうかを、ランダムに取り出した100個のサンプルから評価していく場合には、おおまかにではありますが、t検定とz検定のどちらの方法を用いても検定を行うことができます。
では、t検定とz検定の違いはどこにあるのでしょうか?
母分散が分からない場合に用いる
t検定のz検定の決定的な違いは、「母分散が既知か未知か」ということです。
z検定は、母集団の分布の分散である母分散が既に分かっている場合にのみ、用いることができる検定方法です。
先ほどの工場の部品で言えば、部品の重さのばらつきは2gまでとしていることが既に分かっている場合はz検定を行うことができます。
一方でt検定は、母集団の分散が分かっていなくても検定を行うことができる方法です。
工場の部品のように事前に平均と分散が規定されている場合もありますが、一般的に統計解析を行う場合には、母集団の分散が分からないという場面がほとんどなので、実際はz検定よりt検定を行う機会の方が多いのではないかと思います。
t検定の手順
それでは実際にt検定の手順について紹介していきたいと思います。
仮説検定全般の手順やz検定については「仮説検定とは 推定との違いや活用事例とともに解説」の記事でも詳しく紹介しているので、おさらいをしたい方はそちらの記事も読んでみてください!
まずは、t検定を行う手順を大まかにまとめたいと思います。
➀ 仮説を立てる
➁ 有意水準を設定する
➂ 検定統計量であるt値を求める
➃ t分布表などを用いてp値を求める
➄ p値と有意水準を比較して有意差を判定
➀と➁はどの仮説検定でも同じ手順を踏みますが、➂の検定統計量の計算はz検定とは異なります。
t検定の検定統計量は「t値」と呼ばれます。
先ほど紹介した部品の例のように、母分散が分からない場面で母平均に対する検定を行う場合には、以下の式によって求めることができます。
z検定の検定統計量と似たような式となっていますが、母分散にあたる部分が「不偏分散」に代わっています。
t検定は母分散が分からない場面での検定なので、母分散の代わりに得られたデータから求めた不偏分散を利用しています。
不偏分散は以下の式で求めることができますが、通常分散を求める時にnで割る部分をn-1で割るというだけの違いなので、ぜひ覚えて欲しい式です!
このようにして求められたt値は、自由度n-1のt分布に従います。
このことを用いて、④にあたるp値を求めていくことになります。
p値は、t分布表などを用いることでも求めることができますが、Excelなどのツールを使っても簡単に求めることができます。
今回はp値の算出については詳しく紹介しませんが、自分が使いやすいツールを使ってp値を求めてください!
p値を求めた後は、これまでの仮説検定の流れと同様に有意差の判定をして検定が終了します。
t検定の種類を具体例と共に紹介!
t検定は、先ほど紹介したような母分散が分からない場面での母平均に対する検定だけではなく、様々な場面で活用できる非常に汎用性の高い検定です。
ここからはt検定の種類について、どのような場面で使われるのか具体例とともにいくつか紹介していきたいと思います。
1標本t検定
1標本のt検定は、先ほど紹介した工場の部品の例と同様で、得られたデータからある1つの値である母平均と等しいかどうかを検定するものです。
1つの標本から得られた情報をもとに母平均との比較を行うので「1標本」のt検定と呼ばれます。
2標本t検定
上の説明を読んで気づいた方もいるかもしれませんが、2標本t検定は2つの標本から得られる情報を用いて、2つの集団の平均に差があるかどうかを検定するものです。
例えば、Aクラスの英語の平均点とBクラスの英語の平均点に差があるかどうかを検定する場合には、2標本t検定を利用します。
「英語の平均点が65点かどうか」など、特定の値に対して検定をするわけではないので、先ほどの1標本t検定は使えないということが分かるかと思います。
また、2標本t検定には「対応のないt検定」と「対応のあるt検定」の2種類があります。
この2つの検定方法の違いは、簡単に言うと「同一人物での比較をしているかどうか」の違いになります。
先ほどの英語の点数の例で言うと、AクラスとBクラスでは同一人物がいない中で平均点を比較することになるので「対応のないt検定」となります。
一方で、Aクラスの中で2回英語のテストを実施して、1回目と2回目の平均点に差があるかどうかを検定したい場合には、同じAクラスの生徒の平均点を比較することになるので「対応のあるt検定」となります。
等分散性による違いも?
実は、対応のない2標本のt検定にはさらに細かい種類が存在しています。
ここからは少し細かい内容になるので、ざっくりと読んでいただいても大丈夫です。
対応のない2標本のt検定では、2つの集団の分散が等しいという前提の下で検定を行っています。
しかし、2つの集団の分散が等しいということを仮定して考えても、標本の分散に大きな差があり、仮定するのが難しい場面も出てきます。
ここでは詳しくお話はしませんが、2つの集団の分散が等しいと仮定できないと判断された場合には「welchのt検定」という方法を用います。
少し複雑になってきたので、t検定の種類についてフローチャートを書いてみました。
今回はそれぞれのt検定統計量の紹介はしませんでしたが、比較したいものやどのような集団と比較しているかによって、同じt検定でも異なる検定統計量を使うことになるので、状況をよく考えて使う必要があります!
その他、回帰分析を行う際にも、適切に予測できているのかを判断する材料としてt検定が用いられていますが、回帰分析についての詳細は別の記事で解説していきたいと思います。
今回は、t検定がさまざまな場面で利用されるということを覚えてもらえればと思います!
まとめ
今回は、汎用性の高い検定の1つである「t検定」について、検定の手順やt検定が使える場面について紹介していきました。
実際にt検定が使える場面はとても多いのですが、どんな場面でも当てはまる訳ではありませんので、注意しましょう。
検定の目的は何か、既に分かっている情報は何か、などを丁寧に確認しながらt検定を使いこなせるようになると、統計学の理解も深まっていきます。
気になった方は、統計検定などの実践問題を通してt検定について学ぶことをオススメします!