4.4.条件付き確率分布

$\newcommand{\lnl}{\\[8pt]}$ $\newcommand{\Lnl}{\\[18pt]}$ $\newcommand{\delt}{\mathrm{d}}$ $\newcommand{\comb}{\mathrm{C}}$ $\DeclareMathOperator*{\ssum}{\Sigma}$ $\DeclareMathOperator*{\sprod}{\Pi}$
条件付き確率はこちらのページで学びました.
忘れてしまった方は上記のページにて復習ください.

本ページでは確率変数を元にした条件付き確率分布や確率変数の独立について学んでいきます.

条件付き確率分布

2次元確率変数$(X,Y)$で$X,Y$どちらかの値が与えられたときのもう一方の確率分布を考えることができます.例えば$X$を身長 , $Y$を年齢としたとき $Y=10$歳が与えられたときの$X$の分布は通常の身長の分布よりだいぶ小さくなることが想定されますよね.
下のグラフは年齢ごとの身長の平均ですが, 10歳の平均と全体の平均は明らかに違うことが見て取れます.

(データの出典:平成29年度 スポーツ庁 体力・運動能力調査より筆者加工)

このように, ある条件を与えるともう一方の確率変数の分布に影響を与えることがわかります.このような分布を$Y=y$が与えられたときの$X$の条件付き確率分布(Conditional Probability Distribution of $X$ given $Y=y$)といいます.

離散型の場合その条件付き確率関数(Conditional Probability Function)は, 条件付き確率の定義より, $f_Y(y) > 0$のとき,

\begin{align}
f_{X|Y}(x|y) =P(X=x|Y=y) = \frac{P(X=x,Y=y)}{P(Y=y)} =  \frac{f_{X,Y}(x,y)}{f_Y(y)}
\end{align}

となります.また, 連続型の場合も同様に,条件付き確率密度関数(Conditional Probability Density Function)を
\begin{align}
f_{X|Y}(x|y) =  \frac{f_{X,Y}(x,y)}{f_Y(y)}
\end{align}

で定義することにします.

確率変数の独立

確率変数$X,Y$が独立(independent)であるとは,その確率(密度)関数$f_{X,Y}(x,y)$が,

\begin{align}
f_{X,Y}(x,y) = f_X(x) f_Y(y)
\end{align}

で表されることをいいます.

これは,条件付き確率(密度)関数$f_{X|Y}(x|y)$が,

\begin{align}
f_{X|Y}(x|y) = \frac{f_{X,Y}(x,y)}{f_Y(y)} = \frac{f_X(x) f_Y(y)}{f_Y(y)} = f_X(x)
\end{align}

となり, $y$の値によらずに決まることと同値です.

3次元以上の場合も同様です. $X_1,X_2,\cdots,X_n$が独立であるとはその確率(密度)関数$f_{\bm{X}}$が周辺確率(密度)関数$f_{X_1},\cdots,f_{X_n}$の積で表されることをいいます.つまり,

\begin{align}
f_{\bm{X}}(\bm{x}) = f_{X_1}(x_1) f_{X_2}(x_2) \cdots f_{X_n}(x_n)
\end{align}

となります.