2011年頃から「ビッグデータ」というキーワードが注目されはじめ、2013年には『統計学が最強の学問である』という本が出版され、大きな話題となりました。
年を追うにつれ、多くの人が統計学に関心を持ち始めていますが、「具体的に統計学って何なの?」と思う方も少なくないと思います。
そこで今回、統計学とは何なのか、そして統計学を学ぶメリットとは、といったよくある疑問について解説していきます。
是非この機会にしっかり身につけておきましょう!
この記事を読むと分かること
- 統計学とは
- 統計学が果たす社会的役割
- 幅広い分野で応用可能な統計学
- 統計の基礎は確立されている
- さらなる活躍が期待される統計学
是非最後まで楽しんで読んでいただければ幸いです!
統計学とは?
一般的には、「統計学は、データを収集・集計し、様々な分析手法を用いて、その規則性・不規則性を明らかにする」というように定義されることが多いです。
これは非常に分かりやすく、皆さんが持っている統計のイメージにも近いのではないでしょうか。
そんななか、広江守俊氏は著書『街角の統計学』のなかで以下のような少し踏み込んだ統計学の定義を述べています。
「統計学とは、いかなる分野での科学的推論において、導かれた結論に含まれる不確実性の度合いを明らかにする学問」
一般的な定義とは、少し違いますね。難しい言い回しですが、言い得て妙です。
「推論という不確実な情報について、不確実さの度合いを加味することで、利用可能な知識にしていくのが統計学である」ということを、この定義では示しています。
例を挙げて考えましょう。
例えば、「Aという商品の客層は20代女性だ」という不確実な情報(推論)があったときに、統計学では、それに関するデータを収集・分析して、その情報(推論)がどれほど信頼できるものなのかを数値で表します。
その結果、「Aという商品の客層は20代女性だ」という不確実な情報は、利用可能な知識へと変わるのです。
これをまとめると、「不確実な情報」+「不確実さの度合い」=「利用可能な知識」ということです。
統計学は、そのままでは意味のない知識を、利用可能な知識に変えていくというふうにも受け取れますね。興味深い定義です。
また、この定義の中の「いかなる分野での科学的推論」という箇所からも、統計学の特異な性質が読み取れます。
これは、統計学が他のいかなる科学分野にも関係・寄与する学問であることを示しています。
つまり「統計学は、自然科学のみならず、社会科学、人文科学など、あらゆる科学に寄与する、非常に応用の利く学問である」という含蓄のある定義とも言えます。
統計学における3つの考え方
統計学では、以下の3つの考え方があります。
記述統計
記述統計学とは、実際に全ての標本を調査し、全体像を捉える方法です。
例えば、学校のテストの平均点、生徒の身長などで使われることが多いです。
推測統計
推測統計とは、母集団から一部の標本を抽出し、全体像を推測する方法です。
テレビの視聴率、選挙の開票予測などはまさに推測統計ですね。
母集団を全て調べるのがあまりに非効率な場合などで、よく使われます。
ただ、あくまで母集団から標本を抽出しているので、標本抽出において偏りが生じないよう無作為抽出(ランダムサンプリング)をすることが重要となります。
ベイズ統計
ベイズ統計とは、限られたデータから全体像を推測する方法。
ベイズ統計の例で最も有名なのは、迷惑メールフィルターです。
意外に身近なところで統計学が活用されている例ですね。
詳細については、別のブログで説明しますが、状況に応じて上記の方法を使い分けていくことが重要です。
統計学が果たす社会的役割
統計学が果たす役割は様々ですが、大きく以下の4つに分類できます。
計量化
計量化といっても、ただデータを集計するだけではありません。
たとえば、IQやGNP、日経平均などの概念を数値化して、客観的に捉えることができるようにするのも統計学の果たす大きな役割の1つです。
予測
予測は、ビジネスで大きく役に立つ役割だといえます。
たとえば、予測に使われる回帰分析という統計手法があります。
これは、これまでのデータを最も的確に表現している回帰直線を求めることで、未確定の事柄についてもある程度予測できるようになるというものです。
たとえば、喫茶店を経営していて、「今日は気温が35度だから、だいたいこれくらいケーキが売れるはず、だからこれくらい準備をしておこう」と、勘ではなく統計的に正しい売上予測やケーキの準備が出来るようになるのです。
予測は様々なビジネスで活躍している統計の役割の1つです。
仮説検証
仮説検証は、2つの仮説があるときに、データ分析に基づいて、どちらか一方の仮説を選択するという手法です。
たとえば、「このコインは正常なものである」という仮説を検証するとします。
その際、どのようにして、正常なコインか、そうでないかの判断をするかが非常に重要で、その適切な方法や基準を決めるところで、統計の知見(特に、二項分布という確率分布式)が必要となってきます。
分類
統計学でいう分類とは、データを属性ごとに分類することです。
たとえば、入試の合格基準点を決めるときに使われます。
70点以上が合格という学校側の基準があったとしても、年度によって入試の難易度、平均点も変わってくるので70点が適切な基準でない可能性も考えられます。
そんなとき、過去の受験生の点数や合格実績から適切な合否の基準を計算して求め、年度ごとに適した合格基準を決めることができます。
幅広い分野で応用可能な統計学
現代の学問の多くは、実証分析を伴うものであり、それらにおいて統計学は必須の学問だと言えます。
なぜなら、それらの学問は、様々な数値データ(定量データ)、もしくはカテゴリカルデータ(定性データ)の分析で、数多くの実証を重ね、学問の発展につなげてきたからです。
なかでも、医学、薬学においては統計学は非常に重要視されています。
適切な治療法、新薬の開発という人命に関わる調査が、統計学に基づかない独自の方法で行われていたら、どうでしょうか。皆さん不安ですよね。
そのため、医療業界では統計に基づいた開発が欠かせないのです。
このようにして、統計学はあらゆる学問の根幹を揺るぎないものにしています。
統計学の応用範囲が広いことは、ビジネスにおいても同じです。
今や個人商店、会社問わず、データを持っていない会社はありません。
たとえば、売上、仕入、在庫管理、工数管理など、あらゆる業務にデータは潜んでいます。
これらのデータを正しく分析すれば、商品が売れなかった要因、多くの工数を使った割に利益が芳しくない事業、など様々な経営課題が見えてきます。
統計学は、あらゆる学問を支えているのと同様に、あらゆるビジネスにおいて活躍する可能性を秘めた学問なのです。
統計の基礎は確立されている
学問では、新たな発見に伴い、従来正しいとされてきた知識が突然正しくないものとして塗り替えられてしまうことがしばしばあります。
その点、統計学は1900年代初頭には現在と同じ形の基礎が既に確立されており、様々な発展は遂げてきたものの、その基礎は変わっていません。
基礎をどのように活用していくかが重要な学問なので、急に革新的な発見があって基礎が揺らぎ、今まで学んできた知識が変わってしまう!ということもありません。
つまり、「今学んだことが生涯にわたって活用し続けられる知識となる」という点も統計学を学ぶメリットの一つです。
さらなる活躍が期待される統計学
2020年になり、いよいよ5G(次世代高速通信)の本格的なサービス展開が目前に迫ってきました。2023年には、本格普及していると予想されています。
5Gの到来により、より多くのデータを簡単に収集出来るようになるといわれており、それに伴いデータ分析を活用したビジネス(Webマーケティング等)が、より盛んになることでしょう。
しかし、それでも現時点で統計を学んでいる人はマイノリティです。
5Gが普及し、データビジネスのビッグウェーブが来る前に、今のうちに統計的知見を身につけ、社内外で重宝される人財を目指しましょう!
↓この記事を読んだ方の多くは、以下の記事も読んでいます。