統計学

箱ひげ図とは 読み取り方や作成方法(Excel)を解説!

▼運営者イチオシのデータ活用特化型のスクールはこちらから!▼


【説明会無料】これからデータ分析を学びたい方にオススメのオンラインスクール

オススメポイント

  1. 年間2200名の社会人が受講している日本屈指のデータサイエンススクールなので安心!
  2. データサイエンスの基礎や、Excelでのデータ分析など講座の種類が豊富!
  3. 参加無料の説明会、体験会がある!
  4. スクールにありがちなしつこい勧誘がない(←ココ重要!)

今回は統計の基礎である箱ひげ図について解説していきます。

箱ひげ図は統計検定3級でよく問われる範囲です。

また、ビジネスの場でも活用出来る図ですので、この機会に覚えておきましょう!

箱ひげ図とは

箱ひげ図は、データのばらつきを表した図です。

その名の通り、下のように四角形(箱)に線(ひげ)が付いた図です。

箱ひげ図は、5数要約(最小値、第一四分位数、中央値、第三四分位数、最大値)を図として視覚化したものともいえます。

データがどのあたりに密集しているのか、などを一目で把握することが出来る便利な図です。

箱ひげ図の作るための準備

まずは、手書きで箱ひげ図を作成する際の書き方をご紹介します。

箱ひげ図を作るには、5数と呼ばれる値(最小値、最大値、四分位数)が必要となります。

  • 最小値・・・全データの中で最も小さい値
  • 最大値・・・全データの中で最も小さい値
  • 四分位数・・・全データを4等分した点。

四分位数については、下記ブログを参考にしてください。
四分位数とは 特徴や計算方法や読み取り方など解説

あとは可能であれば、平均値を求めておくと、平均値も箱ひげ図の中に書くことが出来るのでより良いです。

それぞれ求めておきましょう。

ただし、最小値最大値には注意点があります。

それは外れ値が存在する場合は、外れ値を除いた最小値最大値で箱ひげ図を書くということです。

外れ値がある場合は、外れ値のみ別で表示させるためです。

外れ値は、四分位範囲の値の1.5倍、第1四分位と第3四分位から数えて上回るかどうかでか判断します。

それでは、実際に箱ひげ図を書いていきましょう。

箱ひげ図の書き方

箱ひげ図は、以下の手順で書いていきます。

  1. 中央値の線を引く。
  2. 第1四分位数、第3四分位数の線を引く
  3. 縦線でつないで箱にする。
  4. 外れ値を除いた最小値最大値の短い線を引く
  5. 縦線で箱と結ぶ。(ひげ部分)
  6. 外れ値の点を書く
  7. 平均値を示す×マークを書く(コレは別になくてもよい)

まず、中央値の線を引きます。

線の長さに決まりはありませんので見やすいと思う長さでかまいません。

次に、中央値に平行で、同じ長さの第1四分位数、第3四分位数の線を引きます。

それらを、垂直になる縦の線でつないでいきます。

そうすると、箱ひげ図の箱の部分が完成しました。

次に、外れ値を除いた最小値、最大値の短めの線を引きます。

それらを箱と垂直になる線で結びます。

この線が、「ひげ」にあたる部分です。

今回は、データの小さい側に外れ値があると仮定して、最小値の下に外れ値を示す点を書きます。

最後に、平均値のマーク「×」をつけます。コレで完成です。

ちなみに、平均値のマークは、なくてもかまいませんので、つけない場合は、外れ値を書いたところで完成です。

今回は、縦向きの箱ひげ図でしたが、横向きでも作ることは可能です。

是非いろんな箱ひげ図を作ってみてください。

Excelで箱ひげ図を作ってみよう!

Excel 2013以前は、Excelで箱ひげ図を作るには、棒グラフの書式設定を変更して、箱ひげ図のように見せる必要がありました。

それがなんと、Excel 2016からはグラフの挿入から、簡単に箱ひげ図が作れるようになりました。

せっかくなので、この機能を使って、実際にExcelを使って箱ひげ図を作ってみましょう。

まずは元となるデータを用意します。

今回は以下のようなダミーデータを用意しました。

箱ひげ図にする範囲を選択して、

挿入→統計グラフの挿入→箱ひげ図の順に選択していきます。 

すると、以下のような図が完成しました。

グラフタイトルを、「家賃(円)」に変更し、

デフォルトで入っている1を削除し、

凡例(右)を追加すると、以下のようになります。

見やすくなりましたね。

そして、箱ひげ図の読み取り方は以下の通りです。

5数や平均値など様々な値を視覚的に比較できるので便利です。

それぞれの線の長さで、データがどこに密集しているかが一目瞭然です。

また、箱の部分は四分位範囲を示しています。

四分位範囲を確認すると、20代は他の年代に比べ、データのばらつきが小さいということが分かります。

このように、一目見ただけで様々な値の特徴が分かることが箱ひげ図の優れた点です。

また、手書きでは5数をそれぞれ求める必要がありましたが、Excelの箱ひげ図機能を使えば、いちいち5数を出さなくても箱ひげ図を出力することが出来るのが優れた点です。

是非、棒グラフや折れ線グラフなどのように主流なグラフではありませんが、データの特徴を表現する方法の1つとして知っておくと便利です。

是非覚えておきましょう。

↓この記事を読んだ方の多くは、以下の記事も読んでいます。

統計検定3級の重要用語一気読み!【統計検定3級のキホン】

たった3日で統計調査士を取得した勉強法をご紹介!【統計検定】

統計検定2級の学習にオススメのコンテンツまとめ!

データ分析を学びたい方へ

私自身、今ではデータ分析を仕事の一つにしています。

しかし、未経験スタートだったので、周囲との差もあり非常に大変な思いをしました。。

もし今転職をやり直すならば、あらかじめスクールに通って、ある程度知識を付けたうえで転職すると思います。

データ分析を仕事にしたい方は、一度データミックスの無料説明会に参加してみるのがオススメです!

話を聞くだけでも、自分のキャリアを考えるいいキッカケになると思いますよ!

オススメポイント

  1. 年間2200名の社会人が受講している日本屈指のデータサイエンススクールなので安心!
  2. データサイエンスの基礎や、Excelでのデータ分析など講座の種類が豊富!
  3. 参加無料の説明会、体験会がある!
  4. スクールにありがちなしつこい勧誘がない(←ココ重要!)

↓無料で説明会に参加したい方は、以下のURLから!↓
【データミックス】データサイエンティスト育成スクールの無料説明会参加

  • この記事を書いた人

Nissy

同志社大学卒。 人事・経理、コンサルを経験し、現在はWebマーケティングやSEOライター、ブログ運営など、幅広い活動をしています。 【保有資格】 統計検定2級 統計調査士 ビジネス統計スペシャリスト ウェブ解析士 GAIQ(GoogleAnalytics個人認定資格) 全日本SEO協会認定SEOコンサルタント

-統計学
-, ,