こんにちは!統計ブロガーのにっしーです!
今回はF検定について説明していきたいと思います!
この記事を読むと分かること
・F検定の概要
・F検定を使うときの注意点
・他の検定との違い
ビジネスをしていると、2つの店舗の売上の違いや新商品と前の商品の販売数の違いなど、2つのデータの集合の違いを比較する場面があるでしょう。このような2つのデータが与えられたとき、2つのデータがどれだけ違うかをあなたならどう判断するでしょうか。多くの人が一番先に思いつくのが、平均値を比較することでしょう。では、もし平均値がほとんど変わらない値であれば、2つのデータに違いはないと結論づけられるでしょうか。
F検定はこのように、「2つのデータの集合に分散の違いがあるか」を調べるための統計学的手法です。この記事では、F検定の概要や注意点、他の検定との違いや具体例を説明していきます。
F検定とは
F検定とは、2つのデータの集合の分散が等しいかを検定する手法です。分散とはデータの散らばり具合を示す数値で、値が大きいほどデータの値がバラバラに存在することを示します。
F検定は、この分散に注目して、2つのデータが同じ分散を持っているという仮説が成り立つかどうかを検証します。
F分布とは
F検定では、F分布という確率密度関数を使います。
F分布とは、独立にカイ2乗分布にしたがう確率分布A、Bとその自由度m、nで表される分布です。
ここで、カイ2乗分布とは、母分散の区間推定や適合度の検定に使われる分布のことをいいます。
また、自由度とは、「与えられたデータのうち、自分で自由に値を決められる値」のことを表します。
例えば、三角形の内角は、180度と決まっているので、2つ角度を決めてしまうと残りの1つの角は自動的に決まってしまいます。
このようなとき、自由度は2だと言えます。
さらに、比較するデータがそれぞれ独立に正規分布にしたがう場合、それぞれのデータをデータA、データBとするとFは以下のように表されます。
ここで、と
はそれぞれデータA、データBの個々のデータの値、
と
はそれぞれデータA、データBの標本平均を表します。また、
と
の分母にあるm-1とn-1は不偏分散の自由度を表しています。
データA、データBの自由度がm、nであるのに対し、不偏分散の自由度がm-1、n-1になることに注意しましょう。これは、標本平均が制約条件としてあることにより、1だけ自由度が減ったためです。つまり、先程の三角形の例のように、すべてのデータの足し算の合計の値が決められているので、データの値を順番に決めていくと残りの1つのデータは自動的に決まってしまうのです。
F分布は2つのデータの自由度の値によって、形が変わります。以下の図はF分布のいくつかの例を表したものです。
自由度が大きくなればなるほど、統計量Fの値が1になる確率が大きくなることがわかります。
F検定の注意点
F検定を利用すれば、2つのデータの集合の分散に違いがあるかを調べられます。しかし、どの2つのデータ間でもF検定が使えるわけではありません。
F検定を利用するには、2つのデータがそれぞれ正規分布にしたがっていなければなりません。
したがって、F検定をする際にはまず、2つのデータを図示して、正規分布にしたがっているかを確認しましょう。
F検定と他の検定との違い
統計学には他にもt検定やカイ2乗検定などの検定方法が存在します。F検定とそれぞれの検定はどう違うのでしょうか。
t検定は2つのデータの平均値に差があるかどうかを知りたいときの手法です。
また、カイ2乗検定は値が連続していない変数同士に関連があるかどうかを調べるための検定です。
一方、F検定は2つのデータの分散が等しいかどうかを調べるための検定です。
それぞれの検定で調べたいものは異なるため、あなたが調べたいものごとにどの検定を使うかを判断しましょう。
F検定の具体例
それでは、実際のデータを用いてF検定を行ってみましょう。
以下は日本での過去10年間の男女の平均賃金を表した表です。
ここでは簡単のため、以下のデータは正規分布にしたがうとします。
https://www.jil.go.jp/kokunai/statistics/timeseries/html/g0406.html
ここで、帰無仮説と対立仮説を以下のように設定します。
- 帰無仮説:男女の賃金の母分散は等しい(
)
- 対立仮説:男女の賃金の母分散は異なる(
)
帰無仮説とは、検定によって棄却したい仮説のことです。一方、対立仮説は検定によって示したい仮説のことを表します。つまり、ここでは、男女の賃金の分散には差があること示すことがF検定の目的です。
まず、帰無仮説が正しいと仮定しているので、だから、
統計量Fはとなり、不偏分散の比で表されます。
まず、男女でそれぞれ不偏分散を計算します。すると、男女の不偏分散はそれぞれ、16.29、43.75となります。
よって、統計量Fは、になります。
次に、この統計量Fと有意水準5%でのF分布表とを比較します。
F検定では、一般的に有意水準5%で検定します。
有意水準とは、帰無仮説を棄却するか棄却しないかの基準となる値で、有意水準5%とは、「帰無仮説のもとでその事象が起きる確率が5%である」ことを表しています。
F分布は自由度でその形が変わるので、それぞれの場合でどの自由度を使っているかを考えなければなりません。今回は、男女ともに10年間のデータを扱っているため、自由度は1つずつ減って、(9,9)です。自由度が1つ減るのはここでは不偏分散を扱っているからです。
以下の有意水準5%のF分布表から自由度が(9,9)のときの値を読み取ってみましょう。
自由度が(9,9)のF分布の有意水準5%の値は、3.179です。
これは、データから求めた統計量F=2.685より大きい値です。
この場合、帰無仮説は棄却されず、「男女の賃金の分散には違いがあるということはできない」という結論になりました。
まとめ
F検定は、2つのデータの分散の等しさを検定する統計的手法です。この手法では、2つのデータの集合を平均値の違いだけでなく、分散の違いからも調べることができます。
しかし、F分布には元のデータが正規分布であるといった前提条件があるので注意が必要です。
この記事を通じて、F検定の基本的な理解とその適用方法について把握していただければ幸いです。