データの種類
データは大きく分けて2種類に分かれます.
質的データと量的データです.
例えば, 健康診断・体力測定のデータを集めることにしましょう.
おそらくこのようなデータが含まれるはずです.
- 年齢
- 学年
- 性別
- 体重
- 身長
- 体温
- のどの腫れの有無
- 心音の異常の有無
- 虫歯の有無
- 50m走のタイム
- 走り幅跳びの跳躍距離
- ・・・
これらは,量を表している量的データ(Quantitative Data)と質を表している質的データ(Qualitative Data)に分けられます.
例えば,年齢や体重は量を表しているので量的データであり,
性別やのどの腫れの有無は質を表しているので質的データです.
量的データ
量的データの中でも細かい分類があります.
連続データと離散データ
連続データとは身長や体重,50m走のタイムなどのように取りうる値が連続的なデータです.
離散データとは年齢や人数,個数のように取りうる値が離散的なデータです.
間隔尺度と比例尺度
間隔尺度とは,2つのデータ間の間隔のみが意味を持つデータのことです.
例えば, 10度から15度になったからといって150%暑くなったとったとは言いませんよね.
「温度差は5度」であるという風に間隔(差分)だけが意味を持ちます.
温度以外にも年齢も間隔尺度です.
比例尺度とは,2つのデータ間で比率を求めることができるデータのことです.
例えば, 走り幅跳びの跳躍距離は3mと4.5mでは150%距離が違うといえます.
質的データ
質的データは名義尺度と順序尺度に分けられます.
名義尺度
名義尺度とは尺度間に前後関係がない場合です.
例えば,性別や血液型などはどのデータが先とか後とか無いので名義尺度です.
順序尺度
順序尺度は順序付けをできる場合です.
例えば,総合順位,5段階評価など大小を比べることができる場合です.
量的データの間隔尺度に近いですが,順序尺度の場合は引き算などができません.
つまり, 1位と10位の差よりも11位と12位の差のほうが小さいとは言うことができません.
まとめ
まとめるとデータの分類は次のようになります.