4.5.確率変数の変換

$\newcommand{\lnl}{\\[8pt]}$ $\newcommand{\Lnl}{\\[18pt]}$ $\newcommand{\delt}{\mathrm{d}}$ $\newcommand{\comb}{\mathrm{C}}$ $\DeclareMathOperator*{\ssum}{\Sigma}$ $\DeclareMathOperator*{\sprod}{\Pi}$
サイコロを投げる試行において出目の値そのものではなく,その二乗の値についての確率を求めたい場合, どのような確率変数を考えればいいでしょうか.

また, 2つのサイコロを投げる試行において, その出目の和や積の値についての確率を求めたい場合,どうすればよいでしょうか.

本ページではこういうときに便利な確率変数の変換について学びます.

1次元の確率変数の変換

確率変数$X$があり, 新たな確率変数$Y$が$X$のある関数$Y=h(X)$として定義されているとします.
実はどんな$h$でも$Y$が確率変数になるわけではないですが, ここでは$Y$もまた確率変数であると考えます.

$X$が離散型のとき
$Y$の確率関数$f_Y(y)$は,

\begin{align}
f_Y(y) = P(Y=y) = P(h(X)=y) = \sum_{x:h(x)=y}f_X(x) \label{eq-pf}
\end{align}

となります.

$X$が連続型のとき
$Y$の分布関数$F_Y(y)$は,

\begin{align}
&F_Y(y) = P(Y \le y) = P(h(X)\le y) = \int_A f_X(x)\delt x\lnl \label{eq-df}
&A=\{x;h(x) \le y\}
\end{align}

となる.上記が微分可能な場合, $Y$の確率密度関数は$f_Y(y) = \cfrac{\delt}{\delt y}F_Y(y)$で求めることができます.

1次元の確率変数の変換の例

1次元確率変数の変換を2つの具体例を通してみてみましょう.

絶対値変換

$X$を次のような確率関数を持つ確率変数とします.

\begin{align}
&f_X(-2) = \frac{1}{5} ,\quad f_X(-1) = \frac{1}{5} ,\quad f_X(0) = \frac{1}{5} \lnl
&f_X(1) = \frac{1}{5} ,\quad f_X(2) = \frac{1}{5}
\end{align}

このとき$Y=|X|$としたときの$Y$の確率関数$f_Y(y)$を求めます.
$x$の取りうる値は$-2,-1,0,1,2$ですから, $y$の取りうる値は$0,1,2$です.
それぞれに対する確率を$\eqref{eq-pf}$で求めると,
\begin{align}
&f_Y(0) = \sum_{x:|x| = 0} f_X(x) = f_X(0) = \frac{1}{5}\lnl
&f_Y(1) = \sum_{x:|x| = 1} f_X(x) = f_X(-1) + f_X(1) = \frac{2}{5}\lnl
&f_Y(2) = \sum_{x:|x| = 2} f_X(x) = f_X(-2) + f_X(2) = \frac{2}{5}
\end{align}

となることがわかります.

対数変換

$X$を次のような確率密度関数を持つ確率変数とします.

\begin{align}
f_X(x) = \begin{cases} 1&1 < x < 2\\ 0 &\text{その他}\end{cases} \end{align}
$Y=\log X$としたときの$Y$の確率密度関数$f_Y(y)$を求めます.
\begin{align} 1 < x < 2 \Longleftrightarrow 0 < \log x < \log 2 \end{align}
に注意すると,
\begin{align} &y \le 0 \quad \Longrightarrow F_Y(y) = 0\\ &y \ge \log 2 \Longrightarrow F_Y(y) = 1 \end{align}
であり, $0< y < \log2$のときは,$\eqref{eq-df}$から
\begin{align} F_Y(y) = \int_1^{e^y} 1 \delt x = \big[ x \big]_1^{e^y} = e^y - 1 \end{align}
従って確率密度関数$f_Y$は,
\begin{align} f_Y(y) = \begin{cases} e^y & 0 < y < \log 2\\ 0 & \text{その他}\end{cases} \label{eq-log} \end{align}
となります.

$X$の確率密度関数から$Y=h(X)$の確率密度関数を直接導ける場合

$X$の確率$P(a < X < b) = 1$とし, $h$が$(a,b)$で狭義単調の場合, つまり$(a,b)$で変換$h$に逆関数$h^{-1}$が存在する場合, $Y$の確率密度関数$f_Y(y)$は,

\begin{align} f_Y(y) = \begin{cases} f_X\big(h^{-1}(y)\big)\left|\cfrac{\delt h^{-1}(y)}{\delt y}\right| & \alpha < y < \beta\lnl \quad 0&\text{その他}\end{cases}\label{eq-trans1} \end{align}
ただし, $x \in (a,b) \Longleftrightarrow h(x) \in (\alpha , \beta)$とし, $(\alpha,\beta)$で$h^{-1}$が微分可能であるとします.

公式$\eqref{eq-trans1}$を用いた変換の例

上記の「対数変換」の例を$\eqref{eq-trans1}$を使って求めてみましょう.
$h(x)=\log x$は$(1,2)$で単調であり逆関数$h^{-1}(x) = e^x$を持ちます.また$x \in (1,2) \Longleftrightarrow h(x) \in (0,\log 2)$です.
従って, $0 < y < \log 2$で,

\begin{align} f_Y(y) = f_X(h^{-1}(y))\left|\cfrac{\delt h^{-1}(y)}{\delt y}\right| = 1\cdot |e^y| = e^y \end{align}
また, それ以外の$y$で$f_Y(y)= 0$となることから$\eqref{eq-log}$と同じ結論が求められました.

多次元の確率変数の変換(離散型の場合)

$n$次元の離散型の確率変数$\bm{X} = (X_1,X_2,\cdots,X_n)$があるとします.変換$h_1,h_2,\cdots,h_m$が存在し,

\begin{align}
Y_1 &= h_1(\bm{X}) = h_1(X_1,X_2,\cdots,X_n)\\
Y_2 &= h_2(\bm{X}) = h_2(X_1,X_2,\cdots,X_n)\\
&\qquad\vdots\\
Y_m &= h_m(\bm{X}) = h_m(X_1,X_2,\cdots,X_n)
\end{align}

で$m$次元確率変数$\bm{Y} = (Y_1,Y_2,\cdots ,Y_m)$が定義されているとするときの$\bm{Y}$の結合確率関数を求めましょう.
1次元の場合と同様の考え方で求められます.
$\bm{X}$の結合確率関数を$f_X(\bm{x})$とすると,$\bm{Y}$の結合確率関数$f_Y(\bm{y})$は,
\begin{align}
f_Y(\bm{y}) = \sum f_X(\bm{x})
\end{align}

ただし, 和の区間は$h_1(\bm{x}) = y_1, h_2(\bm{x}) = y_2, \cdots ,h_m(\bm{x}) = y_m$を満たす全ての$\bm{x}$に対してとします.

多次元の確率変数の変換(連続型の場合)

$n$次元の連続型の確率変数$\bm{X} = (X_1,X_2,\cdots,X_n)$があるとします.変換$h_1,h_2,\cdots,h_n$が存在し,

\begin{align}
Y_1 &= h_1(\bm{X}) = h_1(X_1,X_2,\cdots,X_n)\\
Y_2 &= h_2(\bm{X}) = h_2(X_1,X_2,\cdots,X_n)\\
&\qquad\vdots\\
Y_n &= h_n(\bm{X}) = h_m(X_1,X_2,\cdots,X_n)
\end{align}

で$n$次元確率変数$\bm{Y} = (Y_1,Y_2,\cdots ,Y_n)$が定義されているとするときの$\bm{Y}$の結合確率密度関数を求めましょう.

$S,T\in \mathbb{R}^n$を$P(\bm{X} \in S) = 1$を満たし, $\bm{x} \in S \Longleftrightarrow \bm{y} \in T$を満たす領域とします.

次の条件が満たされている場合を考えます.
(i)$\bm{y}\in T$に対して次のような逆関数が存在する

\begin{align}
x_1 &= r_1(\bm{y}) = r_1(y_1,y_2,\cdots ,y_n)\\
x_2 &= r_2(\bm{y}) = r_2(y_1,y_2,\cdots ,y_n)\\
&\qquad\vdots\\
x_n &= r_n(\bm{y}) = r_n(y_1,y_2,\cdots ,y_n)
\end{align}

(ii)$\bm{y}\in T$で各$r_i$は各$y_j$で偏微分可能で連続とする
(iii)次の行列式$J$が$T$において$0$ではない.なお$J$をヤコビアンといいます.
\begin{align}
J = \left|
\begin{array}{ccc}
\cfrac{\partial r_1}{\partial y_1}& \cdots &\cfrac{\partial r_1}{\partial y_n}\\
&\cdots &\\
\cfrac{\partial r_n}{\partial y_1}&\cdots&\cfrac{\partial r_n}{\partial y_n}
\end{array}\right|
\end{align}

このとき, $\bm{Y}$の結合確率関数は
\begin{align}
f_Y(\bm{y}) = \begin{cases}f_X\big(r_1(\bm{y}),\cdots ,r_n(\bm{y})\big)|J| & \bm{y} \in T\\
\quad 0&\text{その他}\end{cases}
\end{align}

となります.

結合確率関数を求める例

上記だけだとイメージしにくいと思いますので, 具体例を見ていきましょう.
$X,Y$を確率変数とします.その結合確率関数を$f_{X,Y}(x,y)$とします.

そのとき, $S=X+Y , V=X-Y, W=XY , U=\cfrac{X}{Y}$の確率密度関数は,($U$のときは$P(Y=0)=0$とします)

\begin{align}
&f_S(s) = \int_{-\infty}^{\infty} f_{X,Y}(x,s-x)\delt x \label{eq-wa}\lnl
&f_V(v) = \int_{-\infty}^{\infty} f_{X,Y}(v+y,y)\delt y \label{eq-sa}\lnl
&f_W(w) = \int_{-\infty}^{\infty} f_{X,Y}\left(x,\frac{w}{x}\right) \frac{1}{|x|}\delt x \label{eq-seki}\lnl
&f_U(u) = \int_{-\infty}^{\infty} f_{X,Y}(xu,x)|x| \delt x \label{eq-sho}\lnl
\end{align}

となります.以下これを上記の手順で求めていきます.

和:$S=X+Y$の確率密度関数

$S=X+Y , T=X$とすると、$X=r_1(S,T) = T , Y=r_2(S,T) = S-T$と考えることができヤコビアン$J$は、

\begin{align}
J = \left|
\begin{array}{cc}
\cfrac{\partial r_1}{\partial s}& \cfrac{\partial r_1}{\partial t}\\
\cfrac{\partial r_2}{\partial s}&\cfrac{\partial r_2}{\partial t}
\end{array}
\right| = \left|
\begin{array}{cc}
0 & 1\\
1&-1
\end{array}
\right| = 1
\end{align}

よって$S,T$の結合確率関数$f_{S,T}$は,
\begin{align}
f_{S,T}(s,t) = f_{X,Y}\big(r_1(s,t),r_2(s,t)\big)|J| = f_{X,Y}(t,s-t)
\end{align}

となります.これから$S$の周辺確率密度関数を求めると,
\begin{align}
f_S(s) &= \int_{-\infty}^{\infty} f_{X,Y}(t,s-t) \delt t
\end{align}

$t$を$x$に書き換えても結果は同じですから$\eqref{eq-wa}$が求まります.

差:$V=X-Y$の確率密度関数

$V=X-Y , T=Y$とすると、$X=r_1(V,T) = V+T , Y=r_2(V,T) = T$と考えることができヤコビアン$J$は、

\begin{align}
J = \left|
\begin{array}{cc}
\cfrac{\partial r_1}{\partial v}& \cfrac{\partial r_1}{\partial t}\\
\cfrac{\partial r_2}{\partial v}&\cfrac{\partial r_2}{\partial t}
\end{array}
\right| = \left|
\begin{array}{cc}
1 & 1\\
0&1
\end{array}
\right| = 1
\end{align}

よって$V,T$の結合確率関数$f_{V,T}$は,
\begin{align}
f_{V,T}(v,t) = f_{X,Y}\big(r_1(v,t),r_2(v,t)\big)|J| = f_{X,Y}(v+t,t)
\end{align}

となります.これから$V$の周辺確率密度関数を求めると,
\begin{align}
f_V(v) &= \int_{-\infty}^{\infty} f_{X,Y}(v+t,t) \delt t
\end{align}

$t$を$y$に書き換えても結果は同じですから$\eqref{eq-sa}$が求まります.

積:$W=XY$の確率密度関数

$W=XY , T=X$とすると、$X=r_1(W,T) = T , Y=r_2(W,T) = \cfrac{W}{T}$と考えることができヤコビアン$J$は、

\begin{align}
J = \left|
\begin{array}{cc}
\cfrac{\partial r_1}{\partial w}& \cfrac{\partial r_1}{\partial t}\\
\cfrac{\partial r_2}{\partial w}&\cfrac{\partial r_2}{\partial t}
\end{array}
\right| = \left|
\begin{array}{cc}
0 & 1\phantom{\cfrac{1}{1}}\\
\cfrac{1}{t}&-\cfrac{w}{t^2}
\end{array}
\right| = -\frac{1}{t}
\end{align}

よって$W,T$の結合確率関数$f_{W,T}$は,
\begin{align}
f_{W,T}(w,t) = f_{X,Y}\big(r_1(w,t),r_2(w,t)\big)|J| = f_{X,Y}\left(t,\frac{w}{t}\right)\frac{1}{|t|}
\end{align}

となります.これから$W$の周辺確率密度関数を求めると,
\begin{align}
f_W(w) &= \int_{-\infty}^{\infty} f_{X,Y}\left(t,\frac{w}{t}\right)\frac{1}{|t|} \delt t
\end{align}

$t$を$x$に書き換えても結果は同じですから$\eqref{eq-seki}$が求まります.

商:$U=\cfrac{X}{Y}$の確率密度関数

$U=\cfrac{X}{Y} , T=Y$とすると、$X=r_1(U,T) = TU , Y=r_2(U,T) = T$と考えることができヤコビアン$J$は、

\begin{align}
J = \left|
\begin{array}{cc}
\cfrac{\partial r_1}{\partial u}& \cfrac{\partial r_1}{\partial t}\\
\cfrac{\partial r_2}{\partial u}&\cfrac{\partial r_2}{\partial t}
\end{array}
\right| = \left|
\begin{array}{cc}
t & u\\
0 & 1
\end{array}
\right| = t
\end{align}

よって$U,T$の結合確率関数$f_{U,T}$は,
\begin{align}
f_{U,T}(u,t) = f_{X,Y}\big(r_1(u,t),r_2(u,t)\big)|J| = f_{X,Y}(tu,t)|t|
\end{align}

となります.これから$U$の周辺確率密度関数を求めると,
\begin{align}
f_U(u) &= \int_{-\infty}^{\infty} f_{X,Y}(tu,t)|t| \delt t
\end{align}

$t$を$x$に書き換えても結果は同じですから$\eqref{eq-sho}$が求まります.