統計学

標準偏差、分散とは それぞれの特徴や違い、計算方法を解説

今回は、統計の基礎である「分散」と「標準偏差」について解説していきます!

分散や標準偏差は、統計検定3級でよく問われる範囲でもあり、また2級以上の学習の土台にもなるところです。

この機会にしっかり覚えておきましょう!

分散とは?

分散とは、データのばらつきを表す指標のことです。

具体的には、データ全体の平均からのズレ(データのばらつき)を数値化したものです。

そもそも「データのばらつき」のイメージが掴めない方もおられると思うので、

例を挙げて説明します。

データのばらつき

例えば、4人が受験したテストの点数が、それぞれ40、45,55,60だったとします。

この平均を出すと、50点となります。

次に、点数が0,0,100,100だったとします。

そうすると、この場合も平均点は50点となります。

どちらも平均50点ですが、データの中身は全然違いますよね。

つまり、平均だけではデータがどれだけばらついているのかが分からないため、どれだけ平均を信用していいものなのか、よく分かりません。

そこで出てくるのが、データのばらつきを示す指標である分散なのです。

今回の場合は、おそらく0,0,100,100のグループの方が、ばらつきが大きそうな気がしますね。

実際に、分散でそのばらつきを数値化してみましょう!

分散の求め方

分散の求め方は、

一言でまとめると「平均からのズレ」の二乗の平均です。

公式にすると、以下の通りです。

これだけではよく分からないかもしれないので、

先ほどの具体例を使って計算してみましょう。

一見難しそうな式ですが、要は、

  1. 平均とのズレを求める
  2. ズレの2乗の平均を求める

ということをしているだけです。

ズレを2乗している理由としては、そのままズレを足し引きした場合、プラマイ0になってしまうからです。

プラスのズレとマイナスのズレが相殺し合って0になってしまうのを防ぐためにはどうしたらいいか。

その方法が2乗してマイナスをプラスに変えることだったんですね。

難しそうに見えた分散の公式ですが、意味が分かれば、意外とシンプルに見えると思います。

分散の読み取り方

分散は、0に近ければ近いほどばらつきが小さいことを示しています。

そのため、今回のケースでは、

40、45,55,60のグループの分散が62.5

0,0,100,100の分散が2500 ということで

0,0,100,100のグループの方が分散が大きい(ばらつきが大きい)ということですね。

分散の問題点

データのばらつきを表す指標として便利な分散ですが、

分散には注意すべき点があります。

それは、計算の過程で単位が変わってしまうことです。

どういうことでしょうか。

例えば、「5cm」を二乗すると「25cm2」になります。

つまり、数字を二乗すると、単位も同様に2乗されてしまうのです。

分散では、「平均とのズレ」の合計が0にならないよう、2乗していました。

そのため、元データと異なる単位になってしまっているのです。

元のデータではcmの話をしているのに、「分散は~cm2となりました!」と言われたら少し違和感がありますよね。

その問題を解決した指標が、次にご紹介する標準偏差なんです!

標準偏差とは?

標準偏差は、分散同様データのばらつきを表す指標です。

(ちなみに、標準偏差の「偏差」とは、平均とのズレのことです。)

分散と標準偏差の違い、それは

標準偏差は分散の平方根であるという点です。

前項では、分散は単位が変わってしまうため不都合が起きてしまうという話をしました。

単位を2乗したものを、元の単位に戻すためにはどうしたらいいでしょうか。

そうです!√をつければよいのです!

√をつけることで、元のデータの単位に戻すことが出来ます。

つまり、

標準偏差 = √分散

ということです。

標準偏差の公式は下の通りです。

先ほどの例で、標準偏差を求めると、このようになります。

これで正しい単位のデータのばらつきの数値を求めることが出来ました。

まとめ

分散、標準偏差は、データのばらつきを表す指標です。

分散は「平均からのズレ」の二乗の平均

標準偏差は√分散 で求めることが出来ます。

分散や標準偏差は値が小さければ小さいほどばらつきが少ないということを表しています。

また、分散や標準偏差は、平均だけでは分からないデータのばらつきの大きさまで、読み取ることが出来るようになる非常に便利な指標です。

是非覚えておきましょう!

↓この記事を読んだ方の多くは、以下の記事も読んでいます。

統計検定3級の重要用語一気読み!【統計検定3級のキホン】

たった3日で統計調査士を取得した勉強法をご紹介!【統計検定】

統計検定2級の学習にオススメのコンテンツまとめ!

データ分析を学びたい方へ

私自身、今ではデータ分析を仕事の一つにしています。しかし、未経験スタートだったので、周囲との差もあり非常に大変な思いをしました。

もし今転職をやり直すならば、あらかじめスクールに通って、ある程度知識を付けたうえで転職すると思います。

データ分析を仕事にしたい方は、一度無料の説明会に参加してみることをオススメします。

話を聞くだけでも、自分のキャリアを考えるいいキッカケになると思いますよ!

オススメポイント

  1. 年間2200名の社会人が受講している日本屈指のデータサイエンススクール
  2. データサイエンスの基礎や、Excelでのデータ分析など講座の種類が豊富
  3. 参加無料の説明会、体験会がある

↓無料で説明会に参加したい方は、以下のURLから!↓

【データミックス】データサイエンティスト育成スクールの無料説明会参加



  • この記事を書いた人

Nissy

同志社大学卒。 人事・経理、コンサルを経験し、現在はWebマーケティングやSEOライター、ブログ運営など、幅広い活動をしています。 【保有資格】 統計検定2級 統計調査士 ビジネス統計スペシャリスト ウェブ解析士 GAIQ(GoogleAnalytics個人認定資格) 全日本SEO協会認定SEOコンサルタント

-統計学
-, ,