統計学

記述統計学と推測統計学の違いとは?それぞれの特徴や具体例を解説

▼運営者イチオシのデータサイエンススクールはこちらから!▼

テックアカデミー無料体験

~オススメポイント~

  1. 初心者が9割以上なので安心!
  2. オンライン完結なので、仕事終わりに学べる!
  3. 受講生に1人ずつ現役プロのメンターがつく!
  4. スクールにありがちなしつこい勧誘がないので安心(←ココ重要!)

「統計学」という言葉は、かなり広義かつ大きな括りなので、細かく分類することができます。

なかでも有名な分類方法として、「記述統計学」と「推測統計学」という分類方法があります。

「記述統計学、推測統計学ってそれぞれどういう意味なの?」

「何が大きな違いなの?」

そのような疑問に答えるべく、今回は”記述統計学と推測統計学の違い”について簡単に説明します!

記述統計学とは

記述統計学とは、観測デーの特徴を捉えるための学問です。

観測データとは、ざっくりいうと手元にあるデータのことです。

記述統計学では、母集団の推測は行わず、あくまで観測データの分析がメインです。

記述統計の例を挙げると、以下のようなものがあります。

記述統計の例

  • 国勢調査や人口調査
  • 勉強時間と偏差値の相関分析
  • 全国模試の偏差値
  • ビッグデータを用いた売上データの分析 etc..

「模試の結果から平均点や偏差値を出す」

「会社の1ヶ月の売上データをグラフ化し、分析する」

これらは経験したことがある人も多いのではないかと思います。(偏差値を算出する側はあまりないかもしれませんが・・・)

「記述統計」というお堅い言葉で聞くと難解な気がしますが、

実はかなり身近なもので、多くの人が記述統計だと認識せずに記述統計の考え方を使っているのです。

データをもとに表やグラフを作成して、データの特徴を探るのも記述統計学の一種

そのほか、平均や分散、相関係数などを用いて、データの特徴を分かりやすくすることも記述統計の役割です。

たとえば以下のようなデータがあったとします。

A高校男子テニス部10人の身長データ(cm)

160,174,176,171,165,179,174,168,175,168

ばらばらで少し見にくいですよね。

そのため、度数分布表とヒストグラムにしてみましょう。

図や表を作るだけで、かなり特徴が捉えやすくなりましたよね。

さらに、もっとデータの特徴を分かりやすくするために、平均標準偏差も計算してみましょう。

すると、以下のような計算結果となります。

  • 平均 → 171cm
  • 標準偏差 → 約5.46

算術平均と加重平均の違いとは それぞれの特徴や具体例を解説!

標準偏差、分散とは それぞれの特徴や違い、計算方法を解説

これでただの数字の羅列のように見えたデータの特徴が読み取りやすくなりました。

このデータの特徴をかりやすくするためのテクニックこそが記述統計です。

推測統計学とは

推測統計学は、一部(標本、サンプル)のデータを使って全体(母集団)の特徴を推測する学問です。

最近話題の「ベイズ統計」は、実は推測統計の一種です。

たとえば、テレビの視聴率は推測統計の例として有名です。

テレビの視聴率を算出するために、テレビを持っている日本中の全ての世帯からデータを取るというのが非現実的だというのはなんとなくイメージがつくと思います。

そのため視聴率は、地区ごとに一定数の家庭からデータをとり、それぞれ視聴率を予測しています。

つまり、一部から全体を予測しているので、視聴率は推測統計となるのです。

▼詳しくは以下の記事で解説しています!▼

視聴率と統計学 計算方法や標本調査とのつながりを学ぼう!

そのほかの推測統計の例をあげると以下のようなものがあります。

推測統計の使用例

  • 選挙の当確速報
  • 保険会社が利用する事故発生数予測
  • 新薬の有効性判断
  • モノづくりにおける不良品の発生数予測 etc...

今や、私たちの周りには数え切れないほどのデータがあふれています。

そのため何かを分析しようと思ったときに、それに関する全てのデータを収集して分析することが難しい場合もあります。

むしろ莫大な時間やコストをかけるくらいなら、標本調査で十分だというケースだって往々にしてあります。(まさに視聴率もその一つです。)

例えば、あなたがとあるアンケートを行うことになったとします。

アンケート対象者の母集団は100万人。

実際に100万人にアンケートをとって調査データを集めるのは大変そうな気がしますね。

しかし、これが1000人なら、大変かもしれませんが、まだなんとかなる気がしませんか。

でも、「1000人だったら100万人とは全然違うし、不十分な分析結果になるんじゃ・・・」と思うかもしれません。

実際その通りで、どうしても母集団から一部(標本)を取り出した調査では、母集団の結果とズレが出てしまいます。

(この標本を抽出したことによる誤差を「標本誤差」といいます。そのままですね。笑)

なのでそんなときは、「あくまで100万人のうちの1000人なので、これくらいの誤差は考えられます。これくらい信頼できる分析結果です!と言うことを示すことが出来れば、それで問題ないのです。

実際、100万人の母集団に対し標本が1000人あれば、上下誤差3%程度という精度の高い分析が出来ます。

このように、母集団が大きい場合に活躍するのが推測統計の考え方なのです。

まとめ

今回は、記述統計と推測統計の違いについて解説しました。

簡単にまとめると、以下の通りです。

  • 記述統計は、観測データを分析する統であり、
  • 推測統計は、標本を抽出し、それらをもとに母集団(全体)の姿を予測する統計ということです。

どちらも私たちの身近なところで大活躍している考え方なので、覚えておくと非常に便利です。

↓この記事を読んだ方の多くは、以下の記事も読んでいます。

統計検定3級の重要用語一気読み!【統計検定3級のキホン】

たった3日で統計調査士を取得した勉強法をご紹介!【統計検定】

統計検定2級の学習にオススメのコンテンツまとめ!

データ分析を学びたい方へ

最後まで読んでいただきありがとうございます!管理人のにっしーです!

私は現在、フリーランスとしてデータ分析の仕事をしています。

しかし最初は、未経験スタートだったので、周囲との差もあり非常に大変な思いをしました。。

もし今転職をやり直すならば、あらかじめスクールに通って、ある程度知識を付けたうえで転職すると思います。

データ分析を仕事にしたい方は、一度データミックスの無料説明会に参加してみるのがオススメです!

国内最大級のデータ分析スクールならではの、様々なお話を聞くことができます!

話を聞くだけでも、自分のキャリアを考えるいいキッカケになると思いますよ!


▼無料で説明会に参加したい方は、以下のURLから!▼
無料オンライン説明会/講座開催中【datamix -データミックス-】
~オススメポイント~

  1. 実務で役立つスキルが身につく!
  2. 参加無料の説明会、体験会がある!
  3. スクールにありがちなしつこい勧誘がないので安心!(←ココ重要!)
  • この記事を書いた人

Nissy

同志社大学卒。 人事・経理、コンサルを経験し、現在はWebマーケティングやSEOライター、ブログ運営など、幅広い活動をしています。 【保有資格】 統計検定2級 統計調査士 ビジネス統計スペシャリスト ウェブ解析士 GAIQ(GoogleAnalytics個人認定資格) 全日本SEO協会認定SEOコンサルタント

-統計学
-, ,