2.5.散布図

一つの項目に複数の変数がある場合を考えます.例えば都道府県別に婚姻件数と出生数がある場合などです.
二つの変数間にある関連を視覚的に表すために, 散布図(Scattergram)がよくつかわれます.

(データの出典:第68回日本統計年鑑)

この図のように二つの変数をそれぞれ縦と横にとり, それらの位置をプロットしたものが散布図です.

上記を見ると明らかに婚姻件数が多ければ多いほど出生数が多くなっています.ただし散布図からは因果関係まで正確に読み取ることはできません.「 婚姻件数が多いから出生数が多い」のか「出生数が多いから婚姻件数が多いのか」はたまた別の要因があるのかはこの図からはわかりません.単純に人口に比例して婚姻件数も出生数も決まるということかもしれません.

散布図から読み取れる相関関係

一般にある変数の値が増えれば増えるほど, もう一方の変数の値が増えるような関係にあるとき正の相関関係があるといい, 逆に片方が増えれば増えるほどもう片方が減るような関係にあるとき負の相関関係があるといいます.

また,散布図を書いたときに直線状に並んでいる傾向の度合いにより強い相関関係がある, 弱い相関関係があるなどと表現したりします.

負の強い相関関係の例

相関関係がない例

弱い正の相関の例