2.6.箱ひげ図

$\newcommand{\lnl}{\\[8pt]}$ $\newcommand{\Lnl}{\\[18pt]}$ $\newcommand{\delt}{\mathrm{d}}$ $\newcommand{\comb}{\mathrm{C}}$ $\DeclareMathOperator*{\ssum}{\Sigma}$ $\DeclareMathOperator*{\sprod}{\Pi}$
データを散らばりも含めて視覚的に表す方法として箱ひげ図(box plot)があります.単一のデータの散らばりを表すのにも有用ですが, 複数のデータを比較する際にもとても役立ちます.

箱ひげ図を理解するにはデータの中央値・ 四分位数 ・ 最大値 ・最小値 ・ 外れ値を理解しておく必要がありますので忘れてしまった方は代表値のページ散らばりの尺度のページで復習をお願いします.

箱ひげ図は図のように$Q_0$から$Q_4$と外れ値を一つに表したものです.

$Q_1$~$Q_3$の範囲を表す”箱”と, $Q_0$~$Q_1$ , $Q_3$~$Q_4$の範囲を表す2つの”ひげ”があるので箱ひげ図といいます.

上記では横に書きましたが, 縦に書いても問題ありません.

複数データを比較する

箱ひげ図を用いて複数データ比較する例を挙げます.

この図から読み取れることとして,

  • 全体を通しての最大値はデータ3の最大値に一致する
  • 全体を通しての最小値はデータ2の最小値に一致する
  • データ1とデータ2の中央値は等しい
  • データ2のほうがデータ1よりも幅の広い分布になっている
  • データ3はすこし右にゆがんだ分布となっている

などがあります.