統計学

記述統計学と推測統計学の違いとは?それぞれの特徴や具体例を解説

▼運営者イチオシのデータ活用特化型のスクールはこちらから!▼


【説明会無料】これからデータ分析を学びたい方にオススメのオンラインスクール

オススメポイント

  1. 年間2200名の社会人が受講している日本屈指のデータサイエンススクールなので安心!
  2. データサイエンスの基礎や、Excelでのデータ分析など講座の種類が豊富!
  3. 参加無料の説明会、体験会がある!
  4. スクールにありがちなしつこい勧誘がない(←ココ重要!)

「統計学」

この名称はかなり広義で、かつ大きな括りなので、その内部を細かく分類することができます。

なかでも有名な分類方法として、記述統計学と推測統計学という分け方があります。

「記述統計学、推測統計学ってそれぞれどういう意味なの?」

「何が大きな違いなの?」

そのような疑問に答えるべく、今回は”記述統計学と推測統計学の違い”について簡単に説明します!

記述統計学とは?

記述統計学とは、観測デーの特徴を捉えるための学問です。

観測データとは、ざっくりいうと手元にあるデータのこと。

記述統計学では、母集団の推測は行わず、あくまで観測データの分析がメインです。

記述統計の例を挙げると、以下のようなものがあります。

記述統計の例

国勢調査や人口調査
勉強時間と偏差値の相関分析
全国模試の偏差値
ビッグデータを用いた売上データの分析 etc..

「模試の結果から平均点や偏差値を出す」

「会社の1ヶ月の売上データをグラフ化し、分析する」

これらは経験したことがある人も多いのではないかと思います。(偏差値を算出する側はあまりないかもしれませんが・・・)

「記述統計」というお堅い言葉で聞くと難解な気がしますが、

実はかなり身近なもので、多くの人が記述統計だと認識せずに記述統計の考え方を使っているのです。

データをもとに表やグラフを作成して、データの特徴を探るのも記述統計学の一種

そのほか、平均や分散、相関係数などを用いて、データの特徴を分かりやすくすることも記述統計の役割です。

たとえば以下のようなデータがあったとします。

A高校男子テニス部10人の身長データ(cm)

160,174,176,171,165,179,174,168,175,168

ばらばらで少し見にくいですよね。

そのため、度数分布表とヒストグラムにしてみましょう。

図や表を作るだけで、かなり特徴が捉えやすくなりましたよね。

さらに、もっとデータの特徴を分かりやすくするために、平均標準偏差も計算してみましょう。

すると、

  • 平均 → 171cm
  • 標準偏差 → 約5.46  となります。

算術平均と加重平均の違いとは それぞれの特徴や具体例を解説!

標準偏差、分散とは それぞれの特徴や違い、計算方法を解説

これでただの数字の羅列のように見えたデータの特徴が読み取りやすくなりました。

この分かりやすくするためのテクニックこそが記述統計なのです。

推測統計学とは?

推測統計学は、一部(標本、サンプル)のデータを使って全体(母集団)の特徴を推測する学問です。

最近話題の「ベイズ統計」は、実は推測統計の一種です。

たとえば、テレビの視聴率は推測統計の例として有名です。

テレビの視聴率を算出するために、テレビを持っている日本中の全ての世帯からデータを取るというのが非現実的だというのはなんとなくイメージがつくと思います。

そのため視聴率は、地区ごとに一定数の家庭からデータをとり、それぞれ視聴率を予測しています。

つまり、一部から全体を予測しているので、視聴率は推測統計となるのです。

(↓詳しくは以下の記事で解説しています!)

視聴率と統計学 計算方法や標本調査とのつながりを学ぼう!

そのほかの推測統計の例をあげると以下のようなものがあります。

推測統計の使用例

選挙の当確速報
保険会社が利用する事故発生数予測
新薬の有効性判断
モノづくりにおける不良品の発生数予測 etc...

今や、私たちの周りには数え切れないほどのデータがあふれています。

そのため何かを分析しようと思ったときに、それに関する全てのデータを収集して分析することが難しい場合もあります。

むしろ莫大な時間やコストをかけるくらいなら、標本調査で十分だというケースだって往々にしてあります。(まさに視聴率もその一つです。)

例えば、あなたがとあるアンケートを行うことになったとします。

アンケート対象者の母集団は100万人。

実際に100万人にアンケートをとって調査データを集めるのは大変そうな気がしますね。

しかし、これが1000人なら、大変かもしれませんが、まだなんとかなる気がしませんか。

でも、

「1000人だったら100万人とは全然違うし、不十分な分析結果になるんじゃ・・・」

と思うかもしれません。

その通りです。

どうしても母集団から一部(標本)を取り出した調査では、母集団の結果とズレが出てしまいます。

(この標本を抽出したことによる誤差を「標本誤差」といいます。そのままですね。笑)

なのでそんなときは、

「あくまで100万人のうちの1000人なので、これくらいの誤差は考えられます。これくらい信頼できる分析結果です!

と言うことを示すことが出来れば、それで問題ないのです。

実際、100万人の母集団に対し標本が1000人あれば、上下誤差3%程度という精度の高い分析が出来ます。

(この計算は、区間推定の話になってくるので、また別で記事を書く予定です。)

このように、母集団が大きい場合に活躍するのが推測統計の考え方なのです。

まとめ

今回は、記述統計と推測統計の違いについて解説しました。

簡単にまとめると、

記述統計は、観測データを分析する統であり、

推測統計は、標本を抽出し、それらをもとに母集団(全体)の姿を予測する統計ということです。

どちらも私たちの身近なところで大活躍している考え方なので、覚えておくと非常に便利です。

↓この記事を読んだ方の多くは、以下の記事も読んでいます。

統計検定3級の重要用語一気読み!【統計検定3級のキホン】

たった3日で統計調査士を取得した勉強法をご紹介!【統計検定】

統計検定2級の学習にオススメのコンテンツまとめ!

データ分析を学びたい方へ

私自身、今ではデータ分析を仕事の一つにしています。

しかし、未経験スタートだったので、周囲との差もあり非常に大変な思いをしました。。

もし今転職をやり直すならば、あらかじめスクールに通って、ある程度知識を付けたうえで転職すると思います。

データ分析を仕事にしたい方は、一度データミックスの無料説明会に参加してみるのがオススメです!

話を聞くだけでも、自分のキャリアを考えるいいキッカケになると思いますよ!

オススメポイント

  1. 年間2200名の社会人が受講している日本屈指のデータサイエンススクールなので安心!
  2. データサイエンスの基礎や、Excelでのデータ分析など講座の種類が豊富!
  3. 参加無料の説明会、体験会がある!
  4. スクールにありがちなしつこい勧誘がない(←ココ重要!)

↓無料で説明会に参加したい方は、以下のURLから!↓
【データミックス】データサイエンティスト育成スクールの無料説明会参加

  • この記事を書いた人

Nissy

同志社大学卒。 人事・経理、コンサルを経験し、現在はWebマーケティングやSEOライター、ブログ運営など、幅広い活動をしています。 【保有資格】 統計検定2級 統計調査士 ビジネス統計スペシャリスト ウェブ解析士 GAIQ(GoogleAnalytics個人認定資格) 全日本SEO協会認定SEOコンサルタント

-統計学
-, ,