4.3.多次元の確率変数

$\newcommand{\lnl}{\\[8pt]}$ $\newcommand{\Lnl}{\\[18pt]}$ $\newcommand{\delt}{\mathrm{d}}$ $\newcommand{\comb}{\mathrm{C}}$ $\DeclareMathOperator*{\ssum}{\Sigma}$ $\DeclareMathOperator*{\sprod}{\Pi}$
これまで1次元の確率変数を考えてきました.これはサイコロの例でいうと,1つのサイコロを投げる試行を表す確率変数と考えられます.

ここではサイコロを2つ以上投げる試行を表す確率変数を考えていきたいと思います.

多次元の確率変数

大小2つのサイコロを投げる試行を考えます.大きいサイコロの出目を$X$,小さいサイコロの出目を$Y$で表し, その組合せを一つの確率変数$(X,Y)$と表すと扱いやすそうです.
このように2つ以上の確率変数を用いて表される確率変数を多次元確率変数(Multivariate Random Variable)といいます.

この例で, 「大きいサイコロは$1$ , 小さいサイコロは$6$が出る確率は$\cfrac{1}{36}$である」ということを

\begin{align}
P\big((X,Y) = (1,6)\big) = \cfrac{1}{36} \quad\text{または}\quad P(X=1,Y=6)= \cfrac{1}{36}
\end{align}

と表します.

結合分布関数

多次元の場合にも分布関数を考えることができます.多次元の分布関数のことを結合分布関数(Joint Distribution Function)または同時分布関数といいます.2次元を例にすると次で定義されます.
いま, 確率変数$(X,Y)$を2次元確率変数とし,その結合分布関数$F_{X,Y}(x,y)$は,

\begin{align}
F_{X,Y}(x,y) = P(X\le x, Y\le y)
\end{align}

となる.

結合分布関数の性質

結合分布関数も1次元の分布関数のように次のような性質を持ちます.2次元の分布関数$F_{X,Y}(x,y)$で説明しますが, 3次元以上でも同様です.

結合分布関数の値域は$[0,1]$

つまり,どんな$(x,y)$に対しても

\begin{align}
0 \le F_{X,Y}(x,y) \le 1
\end{align}

全ての変数に対して非減少

つまり , $x_1 < x_2$ とすると,全ての$y_0$で

\begin{align}
F_{X,Y}(x_1 , y_0) \le F_{X,Y}(x_2 , y_0)
\end{align}

また , $y_1 < y_2$とすると, 全ての$x_0$で
\begin{align}
F_{X,Y}(x_0 , y_1) \le F_{X,Y}(x_0 , y_2)
\end{align}

が成り立ちます.

1つの変数を$-\infty$に近づけると確率が$0$になる

つまり ,

\begin{align}
\lim_{x\to -\infty}F_{X,Y}(x , y)=0\\
\lim_{y\to -\infty}F_{X,Y}(x , y)=0
\end{align}

となります.両方が$-\infty$に向かわなくても片方だけで成り立ちます.

全ての変数を$\infty$に近づけると確率が$1$になる

つまり ,

\begin{align}
\lim_{x\to \infty\\y\to \infty}F_{X,Y}(x , y)=1
\end{align}

となります.今度は両方が$\infty$に向かう必要があります.結合分布関数の一部だけが$\infty$に向かう場合の関数の極値は周辺分布関数という別の概念の分布関数となります.詳しくは後述します.

全ての変数で右連続

つまり ,

\begin{align}
F_{X,Y}(x,y) = F_{X,Y}(x+,y) = \lim_{t\to x\\t>0}F_{X,Y}(t , y)\\
F_{X,Y}(x,y) =F_{X,Y}(x,y+) = \lim_{s\to x\\s>0}F_{X,Y}(x , s)
\end{align}

となります.

結合確率関数と結合確率密度関数

1次元の場合と同じように確率関数や確率密度関数に相当するものを考えることができます.離散型と連続型で定義も呼び名も違いますのでそれぞれ紹介します.

結合確率関数

確率変数$X,Y$がそれぞれ離散型とします.このとき,$(X,Y)$を離散型といいます.その確率関数を結合確率関数(Joint Probability Function)といいます.
2次元の結合確率関数は次のように定義されます.(3次元以上も同様)

\begin{align}
f_{X,Y}(x,y ) = P(X=x , Y=y)
\end{align}

結合確率関数の性質

確率関数と同様の性質を持ちます.

結合確率関数の値域は$[0,1]$

つまり, 全ての$(x,y)$に対して

\begin{align}
0\le f_{X,Y}(x,y) \le 1
\end{align}

が成り立ちます.

結合確率関数の総和は$1$

つまり, $x$の取りうる値が$x_1,x_2,\cdots,x_n$ , $y$の取りうる値が$y_1,y_2,\cdots,y_m$の場合,

\begin{align}
\sum_{i=1}^n \sum_{j=1}^m f_{X,Y}(x_i,y_j) = 1
\end{align}

が成り立ちます.

結合確率密度関数

確率変数$X,Y$がそれぞれ連続型とします.このとき,$(X,Y)$を連続型といいます.その確率密度関数を結合確率密度関数(Joint Probability Density Function)といいます.
2次元の結合確率密度関数は次を満たす関数$f_{X,Y}(x,y)$で定義されます.(3次元以上も同様)

\begin{align}
F_{X,Y}(x,y) = \int_{-\infty}^x \int_{-\infty}^y f_{X,Y}(t,s )\delt s \delt t
\end{align}

結合確率密度関数の性質

確率密度関数と同様の性質を持ちます.

結合確率密度関数の値域は$[0,\infty)$

つまり, 全ての$(x,y)$に対して

\begin{align}
0\le f_{X,Y}(x,y) < \infty
\end{align}

が成り立ちます.

結合確率密度関数の全区間での定積分は$1$

つまり,

\begin{align}
\int_{-\infty}^\infty \int_{-\infty}^\infty f_{X,Y}(t,s)\delt s \delt t = 1
\end{align}

が成り立ちます.

周辺分布関数

多次元確率変数の結合確率分布から特定の確率変数の分布を導くことができます.これを周辺確率分布(Marginal Probability Distribution)といいます.また, その分布関数を周辺分布関数(Marginal Distribution Function)といいます.

2次元確率変数$(X,Y)$の分布関数を$F_{X,Y}(x,y)$とすると, $X$の周辺分布関数$F_X(x)$は,

\begin{align}
F_X(x) = P(X \le x) = \lim_{y\to\infty}P(X\le x, Y\le y) = \lim_{y\to\infty}F_{X,Y}(x,y)
\end{align}

で定義されます.

周辺確率関数と周辺確率密度関数

周辺分布関数と同様に, 離散型の場合の周辺確率関数(Marginal Probability Function), 連続型の場合の周辺確率密度関数(Marginal Probability Density Function)も次のように定義されます.

$X$の周辺確率関数$f_{X}(x)$は,

\begin{align}
f_{X}(x) = P(X=x) = \sum_{y}f_{X,Y}(x,y)
\end{align}

$X$の周辺確率密度関数$f_{X}(x)$は,

\begin{align}
f_{X}(x) = \int_{-\infty}^\infty f_{X,Y}(x,y) \delt y
\end{align}

まとめ

結合〇〇関数 , 周辺〇〇関数とたくさん言葉を定義したので混乱したのではないでしょうか.
まとめに変えて, 今回紹介したものを表で表現したいと思います.

ここで示したのは 大小のサイコロを$1$回ずつ投げる試行で, $X$を大きいサイコロ, $Y$を小さいサイコロの出目としたときの確率です.
各セルの確率は等しく$\cfrac{1}{36}$です.これは$(X,Y)$の結合密度関数です. 合計$f_Y(y)$が$Y$の周辺確率関数であり , その累積$F_Y(y)$が$Y$の周辺分布関数です.$f_X,F_X$も同様です.

そして, 結合分布関数は表で青字としたところのように, とある$(x,y)$以下の全てのセルを足した確率です.表では$(x,y)=(2,4)$として塗分けています.この例だと$F(2,4)=\cfrac{8}{36}=\cfrac{2}{9}$となります.


$
\begin{array}{|c||c|*5{c|}|c|c|} \hline
Y\Big\backslash X& 1& 2 & 3 & 4 & 5 & 6 &合計 f_Y(y) & 累積 F_Y(y) \\ \hline \hline
1 & {\color{blue}\frac{1}{36}} &{\color{blue}\frac{1}{36}} &\frac{1}{36} &\frac{1}{36} &\frac{1}{36} &\frac{1}{36} & \frac{1}{6} & \frac{1}{6} \\ \hline
2 & {\color{blue}\frac{1}{36}} &{\color{blue}\frac{1}{36}} &\frac{1}{36} &\frac{1}{36} &\frac{1}{36} &\frac{1}{36} & \frac{1}{6} & \frac{2}{6} \\ \hline
3 & {\color{blue}\frac{1}{36}} &{\color{blue}\frac{1}{36}} &\frac{1}{36} &\frac{1}{36} &\frac{1}{36} &\frac{1}{36} & \frac{1}{6} & \frac{3}{6} \\ \hline
4 & {\color{blue}\frac{1}{36}} &{\color{blue}\frac{1}{36}} &\frac{1}{36} &\frac{1}{36} &\frac{1}{36} &\frac{1}{36} & \frac{1}{6} & \frac{4}{6} \\ \hline
5 & \frac{1}{36} &\frac{1}{36} &\frac{1}{36} &\frac{1}{36} &\frac{1}{36} &\frac{1}{36} & \frac{1}{6} & \frac{5}{6} \\ \hline
6 & \frac{1}{36} &\frac{1}{36} &\frac{1}{36} &\frac{1}{36} &\frac{1}{36} &\frac{1}{36} & \frac{1}{6} & 1 \\ \hline \hline
合計 f_X(x) & \frac{1}{6} &\frac{1}{6} &\frac{1}{6} &\frac{1}{6} &\frac{1}{6} &\frac{1}{6} & \text{—} & \text{—} \\ \hline
累積 F_X(x) & \frac{1}{6} &\frac{2}{6} &\frac{3}{6} &\frac{4}{6} &\frac{5}{6} &1 & \text{—} & \text{—} \\ \hline
\end{array}
$

また, 各関数間の関係を表すと次の通りです.
矢印の始点にある関数に矢印の変換を施すと矢印の終点にある関数になるという意味です.
上段真ん中の$F_{X,Y}(x,y)$からたどってどんな風に関数が変化していくか確かめてみてください.


$
\require{AMScd}
\begin{CD}
F_Y(y)@<{\displaystyle \lim_{x\to\infty}}<< F_{X,Y}(x,y) @>{\displaystyle \lim_{y\to\infty}}>> F_{X}(x)\\
@V{\cfrac{\delt }{\delt y}}VV @V{\cfrac{\partial^2}{\partial x \partial y}}VV @VV{\cfrac{\delt}{\delt x}}V\\
f_{Y}(y)@<<{\displaystyle \int_{-\infty}^\infty \cdot \quad \delt x}< f_{X,Y}(x,y) @>>{\displaystyle \int_{-\infty}^\infty \cdot \quad \delt y}> f_{X}(x)
\end{CD}
$