こんにちは!統計ブロガーのにっしーです!
今回は、統計の基礎であるヒストグラムについて解説していきます。
ヒストグラムはビジネスの現場でも活用できる便利なグラフの一つです。
是非この機会にしっかり覚えておきましょう!
この記事を読むと分かること
- ヒストグラムとは
- ヒストグラムの目的
- ヒストグラムのメリット
- 棒グラフとの違い
- ヒストグラム活用時の注意点
是非最後まで楽しんで読んでいただければ幸いです!
ヒストグラムとは
ヒストグラムは、度数分布をグラフ化したものです。
具体的には、横軸に変数の値をとり、それぞれの階級の区間上に面積が度数と比例するような長方形を描いた、以下のような図となります。
ちなみに、上のような山が1つのヒストグラムのことを単峰性のヒストグラムといいます。
ヒストグラムの目的
ヒストグラムを描く目的は、量的変数の分布の特徴を把握することです。
ヒストグラムを見ることで、以下のように様々な特徴を知ることができます。
ヒストグラムで分かること
- 分布の中心はどのあたりか
- 散らばりはどの程度か
- 全体として左右対称なのか
- あるいはどちらかの裾が長い分布となっているのか
ヒストグラムのメリット
ヒストグラムは、度数分布表から作成する柱状のグラフです。
そのためヒストグラムを使うことで、度数の分布を視覚的に把握することが可能になります。
度数分布表の読み取り方がよく分からないという方でも、ヒストグラムならイメージがつきやすいという場合も多いでしょう。
棒グラフとヒストグラムの違い
でも、棒グラフとヒストグラムは全く異なる性質を持ったグラフなんだ。
これからその違いについて説明するよ。
棒グラフは質的変数の大小を比較する。
棒グラフは、質的変数を使用して作成します。
質的変数とは、性別、血液型、などのカテゴリ分けできるデータのようなイメージです。
たとえば棒グラフでは、国語の点数、数学の点数、英語の点数など異なる項目を1つのグラフの中に組み込むことができます。
それぞれの項目の大きさを比較することが出来るのが、棒グラフのメリットです。
棒グラフでは、棒はそれぞれ独立おり、縦軸横軸にも明確な決まりはなく、棒同士の比較に用います。
以上が、棒グラフの特徴です。
ヒストグラムは連続量を表す。
一方、ヒストグラムは量的変数を使用したグラフです。
ヒストグラムの場合は連続量なので、国語の点数45点以上50点未満、50以上55点未満のように、特定の項目の連続量を表すのです。
度数分布表も連続データを表すものなので、度数分布表をグラフ化するときは、ヒストグラムを使うということですね。
そして、重要なこととして、連続量であるということは、項目に順序があるということです。
棒グラフの例では、国語と数学の並びを入れ替えてもグラフとして成立します。
しかし、ヒストグラムは連続量であるため、それが出来ません。
ちなみに、ヒストグラムのそれぞれの棒がくっついているのは、連続量だからです。
ここがわかると、なぜヒストグラムがこんな形なのか納得できると思います。
また、棒グラフは縦軸横軸に明確な決まりがないのに対して、
ヒストグラムでは、横軸が階級、縦軸が度数と決まっているということも特徴の一つです。
ヒストグラムの特徴をまとめると以下の通りです。
ヒストグラムの特徴
- (連続量なので)全部で一つのまとまり
- 縦軸横軸に決まりがある
- 度数の分布を確認する目的で使われる
ヒストグラム活用時の注意点
ヒストグラムをみることで、どのあたりにデータが密集しているのか、などの度数の分布を視覚的に把握することができます。
ただし、ヒストグラムを作成する際には、注意点もあります。
それは、階級の幅や階級の数を変更すると、グラフが与える印象が変わるということです。
先ほどと同じデータで、階級の幅を5.3から3に変えたところ、下のようなヒストグラムになりました。
階級の幅が狭くなる分、ピンの数も増え、かなり印象が変わったのではないでしょうか。
そのため、適切な階級を設定するということも、ヒストグラムを作成する上ではかなり重要です。
ヒストグラムは統計学において、主流なグラフの1つですので、是非この機会に覚えておきましょう!
↓この記事を読んだ方の多くは、以下の記事も読んでいます。