データ分析 統計学

箱ひげ図とは 概要やExcelでの作成方法を分かりやすく解説

こんにちは!統計ブロガーのにっしーです!

皆さんは箱ひげ図をご存じでしょうか。

箱ひげ図は統計学の基礎でよく出てくる図です。

特に、データのばらつき具合などを把握することができる便利な図で、覚えておくとビジネスの現場でも活用することができます。

また、箱ひげ図は統計検定3級でもよく問われる部分です。

是非この機会にしっかりと身につけましょう!

この記事を読むと分かること

  • 箱ひげ図とは
  • 箱ひげ図の読み取り方
  • Excelにおける箱ひげ図の作り方

是非最後まで楽しんで読んでいただければ幸いです!

箱ひげ図とは

箱ひげ図は、データのばらつきを表した図です。

その名の通り、下のように四角形(箱)に線(ひげ)が付いた図です。

箱ひげ図は、5数要約(最小値、第一四分位数、中央値、第三四分位数、最大値)を図として視覚化したものともいえます。

データがどのあたりに密集しているのか、などを一目で把握することが出来る便利な図です。

箱ひげ図に必要なデータ

箱ひげ図を作るには、5数と呼ばれる値(最小値、最大値、四分位数)が必要となります。

  • 最小値・・・全データの中で最も小さい値
  • 最大値・・・全データの中で最も小さい値
  • 四分位数・・・全データを4等分した点。

四分位数についてよく分からないというかた方は、以下のブログを読んでみてください!
四分位数とは 特徴や計算方法や読み取り方など解説

注意点として、最小値や最大値における外れ値には気を付ける必要があります。

もし外れ値が存在する場合は、外れ値を除いた最小値や最大値で箱ひげ図を書き、外れ値のみ点でプロットさせる書き方が一般的です。

また、外れ値は「四分位範囲の値の1.5倍」で、第1四分位と第3四分位から数えて上回るかどうかで判断します。

箱ひげ図の書き方

箱ひげ図は、以下の手順で書いていきます。

  1. 中央値の線を引く。
  2. 第1四分位数、第3四分位数の線を引く
  3. 縦線でつないで箱にする。
  4. 外れ値を除いた最小値最大値の短い線を引く
  5. 縦線で箱と結ぶ。(ひげ部分)
  6. 外れ値の点を書く
  7. 平均値を示す×マークを書く(コレは別になくてもよい)

まず、中央値の線を引きます。

線の長さに決まりはありませんので見やすいと思う長さでかまいません。

次に、中央値に平行で、同じ長さの第1四分位数、第3四分位数の線を引きます。

それらを、垂直になる縦の線でつないでいきます。

そうすると、箱ひげ図の箱の部分が完成しました。

次に、外れ値を除いた最小値、最大値の短めの線を引きます。

それらを箱と垂直になる線で結びます。

この線が、「ひげ」にあたる部分です。

今回は、データの小さい側に外れ値があると仮定して、最小値の下に外れ値を示す点を書きます。

最後に、平均値のマーク「×」をつけます。コレで完成です。

ちなみに、平均値のマークは、なくてもかまいませんので、つけない場合は、外れ値を書いたところで完成です。

今回は、縦向きの箱ひげ図でしたが、横向きでも作ることは可能です。

是非いろんな箱ひげ図を作ってみてください。

Excelで箱ひげ図を作成する方法

Excel 2013以前は、Excelで箱ひげ図を作るには、棒グラフの書式設定を変更して、箱ひげ図のように見せる必要がありました。

それがなんと、Excel 2016からはグラフの挿入から、簡単に箱ひげ図が作れるようになりました。

せっかくなので、この機能を使って、実際にExcelを使って箱ひげ図を作ってみましょう。

まずは元となるデータを用意します。

今回は以下のようなダミーデータを用意しました。

箱ひげ図にする範囲を選択して、

挿入→統計グラフの挿入→箱ひげ図の順に選択していきます。 

すると、以下のような図が完成しました。

グラフタイトルを、「家賃(円)」に変更し、

デフォルトで入っている1を削除し、

凡例(右)を追加すると、以下のようになります。

見やすくなりましたね。

箱ひげ図の読み取り方

箱ひげ図の読み取り方は以下の通りです。

5数や平均値など様々な値を視覚的に比較できるので便利です。

それぞれの線の長さで、データがどこに密集しているかが一目瞭然です。

また、箱の部分は四分位範囲を示しています。

このように、一目見ただけで様々な値の特徴が分かることが箱ひげ図の優れた点です。

また、手書きでは5数をそれぞれ求める必要がありましたが、Excelの箱ひげ図機能を使えば、いちいち5数を出さなくても箱ひげ図を出力することが出来るのが優れた点です。

棒グラフや折れ線グラフほど主流なグラフではありませんが、データの特徴を表現する方法の1つとして知っておくと便利な図です。

是非この機会に覚えておきましょう。

↓この記事を読んだ方の多くは、以下の記事も読んでいます。

統計検定3級の重要用語一気読み!【統計検定3級のキホン】

たった3日で統計調査士を取得した勉強法をご紹介!【統計検定】

統計検定2級の学習にオススメのコンテンツまとめ!

[PR]※本サイトには、プロモーションが含まれています。

データサイエンティスト育成スクール「データサイエンスアカデミー」

Allegro|データサイエンススクールの初回面談申込

  • この記事を書いた人

にっしー

フリーランス3年目の29歳。 専門統計調査士など、統計に関する資格を複数保有。 自分が数学苦手だった文系だからこそ書ける、分かりやすい情報発信を心がけています。 著書『これから学ぶ人のための統計学超入門』 寄稿実績『知識ほぼゼロからデータ分析の専門家になる(週刊東洋経済)』、『50歳からの学び直し入門 (インターナショナル新書)』(一部)

~人気記事~

1

リスキリングの流れもあり、最近注目度が高まりつつあるデータサイエンス。 データサイエンスは独学で学ぶには少しハードルが高 ...

2

こんにちは!統計ブロガーのにっしーです! 今回は、統計学のキホンを学ぶのに最適な統計検定3級を爆速で取るための重要事項を ...

3

データサイエンススクールがオススメな理由 昨今、データサイエンスを学びたいという人が急増しています。 しかし、データサイ ...

4

こんにちは。統計ブロガーのにっしーです! 「統計学」というとみなさんはどのようなイメージがあるでしょうか。 なんだか少し ...

5

いきなりですが、皆さんは擬似相関という言葉をご存じでしょうか。 擬似相関は、”見せかけの相関”ともいわれる、うっかりして ...

-データ分析, 統計学
-, ,