統計学

記述統計学と推測統計学の違いとは?今さら聞けない統計の基礎の基礎を分かりやすく解説!

2021年2月7日

「統計学」

この名称はかなり広義で、かつ大きな括りなので、その内部を細かく分類することができます。

なかでも有名な分類方法として、記述統計学と推測統計学という分け方があります。

「記述統計学、推測統計学ってそれぞれどういう意味なの?」

「何が大きな違いなの?」

そのような疑問に答えるべく、今回は”記述統計学と推測統計学の違い”について簡単に説明します!







記述統計学とは?

記述統計学とは、観測デーの特徴を捉えるための学問です。

観測データとは、ざっくりいうと手元にあるデータのこと。

記述統計学では、母集団の推測は行わず、あくまで観測データの分析がメインです。

記述統計の例を挙げると、以下のようなものがあります。

記述統計の例

国勢調査や人口調査
勉強時間と偏差値の相関分析
全国模試の偏差値
ビッグデータを用いた売上データの分析 etc..

「模試の結果から平均点や偏差値を出す」

「会社の1ヶ月の売上データをグラフ化し、分析する」

これらは経験したことがある人も多いのではないかと思います。(偏差値を算出する側はあまりないかもしれませんが・・・)

「記述統計」というお堅い言葉で聞くと難解な気がしますが、

実はかなり身近なもので、多くの人が記述統計だと認識せずに記述統計の考え方を使っているのです。

データをもとに表やグラフを作成して、データの特徴を探るのも記述統計学の一種

そのほか、平均や分散、相関係数などを用いて、データの特徴を分かりやすくすることも記述統計の役割です。

たとえば以下のようなデータがあったとします。

A高校男子テニス部10人の身長データ(cm)

160,174,176,171,165,179,174,168,175,168

ばらばらで少し見にくいですよね。

そのため、度数分布表とヒストグラムにしてみましょう。

図や表を作るだけで、かなり特徴が捉えやすくなりましたよね。

さらに、もっとデータの特徴を分かりやすくするために、平均標準偏差も計算してみましょう。

すると、

  • 平均 → 171cm
  • 標準偏差 → 約5.46  となります。

算術平均と加重平均の違いを分かりやすく解説!

統計基礎~標準偏差、分散を分かりやすく解説!~

これでただの数字の羅列のように見えたデータの特徴が読み取りやすくなりました。

この分かりやすくするためのテクニックこそが記述統計なのです。







推測統計学とは?

推測統計学は、一部(標本、サンプル)のデータを使って全体(母集団)の特徴を推測する学問です。

最近話題の「ベイズ統計」は、実は推測統計の一種です。

たとえば、テレビの視聴率は推測統計の例として有名です。

テレビの視聴率を算出するために、テレビを持っている日本中の全ての世帯からデータを取るというのが非現実的だというのはなんとなくイメージがつくと思います。

そのため視聴率は、地区ごとに一定数の家庭からデータをとり、それぞれ視聴率を予測しています。

つまり、一部から全体を予測しているので、視聴率は推測統計となるのです。

(↓詳しくは以下の記事で解説しています!)

視聴率と統計学~標本調査を知る~







そのほかの推測統計の例をあげると以下のようなものがあります。

推測統計の使用例

選挙の当確速報
保険会社が利用する事故発生数予測
新薬の有効性判断
モノづくりにおける不良品の発生数予測 etc...

今や、私たちの周りには数え切れないほどのデータがあふれています。

そのため何かを分析しようと思ったときに、それに関する全てのデータを収集して分析することが難しい場合もあります。

むしろ莫大な時間やコストをかけるくらいなら、標本調査で十分だというケースだって往々にしてあります。(まさに視聴率もその一つです。)

例えば、あなたがとあるアンケートを行うことになったとします。

アンケート対象者の母集団は100万人。

実際に100万人にアンケートをとって調査データを集めるのは大変そうな気がしますね。

しかし、これが1000人なら、大変かもしれませんが、まだなんとかなる気がしませんか。

でも、

「1000人だったら100万人とは全然違うし、不十分な分析結果になるんじゃ・・・」

と思うかもしれません。

その通りです。

どうしても母集団から一部(標本)を取り出した調査では、母集団の結果とズレが出てしまいます。

(この標本を抽出したことによる誤差を「標本誤差」といいます。そのままですね。笑)

なのでそんなときは、

「あくまで100万人のうちの1000人なので、これくらいの誤差は考えられます。これくらい信頼できる分析結果です!

と言うことを示すことが出来れば、それで問題ないのです。

実際、100万人の母集団に対し標本が1000人あれば、上下誤差3%程度という精度の高い分析が出来ます。

(この計算は、区間推定の話になってくるので、また別で記事を書く予定です。)

このように、母集団が大きい場合に活躍するのが推測統計の考え方なのです。







まとめ

今回は、記述統計と推測統計の違いについて解説しました。

簡単にまとめると、

記述統計は、観測データを分析する統であり、

推測統計は、標本を抽出し、それらをもとに母集団(全体)の姿を予測する統計ということです。

どちらも私たちの身近なところで大活躍している考え方なので、覚えておくと非常に便利です。

↓この記事を読んだ方の多くは、以下の記事も読んでいます。

【徹底公開】たった3日で統計調査士を取得した勉強法をご紹介!【統計検定】

【これさえあれば大丈夫】統計検定2級の学習にオススメのコンテンツまとめ!

【知らなきゃ損!?】統計検定2級はペーパー試験よりもCBT受験一択!その理由とは!?







  • この記事を書いた人

Nissy

同志社大学卒。 人事・経理、コンサルを経験し、現在はWebマーケティングやSEOライター、ブログ運営など、幅広い活動をしています。 【保有資格】 統計検定2級 統計調査士 ビジネス統計スペシャリスト ウェブ解析士 GAIQ(GoogleAnalytics個人認定資格) 全日本SEO協会認定SEOコンサルタント

-統計学
-, ,

Copyright© Nissy BLOG , 2021 All Rights Reserved Powered by AFFINGER5.