2.1.データの種類

データの種類

データは大きく分けて2種類に分かれます.
質的データと量的データです.

例えば, 健康診断・体力測定のデータを集めることにしましょう.
おそらくこのようなデータが含まれるはずです.

  • 年齢
  • 学年
  • 性別
  • 体重
  • 身長
  • 体温
  • のどの腫れの有無
  • 心音の異常の有無
  • 虫歯の有無
  • 50m走のタイム
  • 走り幅跳びの跳躍距離
  • ・・・

これらは,量を表している量的データ(Quantitative Data)と質を表している質的データ(Qualitative Data)に分けられます.

例えば,年齢や体重は量を表しているので量的データであり,
性別やのどの腫れの有無は質を表しているので質的データです.

量的データ

量的データの中でも細かい分類があります.

連続データと離散データ

連続データとは身長や体重,50m走のタイムなどのように取りうる値が連続的なデータです.
離散データとは年齢や人数,個数のように取りうる値が離散的なデータです.

間隔尺度と比例尺度

間隔尺度とは,2つのデータ間の間隔のみが意味を持つデータのことです.
例えば, 10度から15度になったからといって150%暑くなったとったとは言いませんよね.
「温度差は5度」であるという風に間隔(差分)だけが意味を持ちます.
温度以外にも年齢も間隔尺度です.

比例尺度とは,2つのデータ間で比率を求めることができるデータのことです.
例えば, 走り幅跳びの跳躍距離は3mと4.5mでは150%距離が違うといえます.

質的データ

質的データは名義尺度と順序尺度に分けられます.

名義尺度

名義尺度とは尺度間に前後関係がない場合です.
例えば,性別や血液型などはどのデータが先とか後とか無いので名義尺度です.

順序尺度

順序尺度は順序付けをできる場合です.
例えば,総合順位,5段階評価など大小を比べることができる場合です.

量的データの間隔尺度に近いですが,順序尺度の場合は引き算などができません.
つまり, 1位と10位の差よりも11位と12位の差のほうが小さいとは言うことができません.

まとめ

まとめるとデータの分類は次のようになります.