数理統計:超幾何分布の性質

$\newcommand{\lnl}{\\[8pt]}$ $\newcommand{\Lnl}{\\[18pt]}$ $\newcommand{\delt}{\mathrm{d}}$ $\newcommand{\comb}{\mathrm{C}}$ $\DeclareMathOperator*{\ssum}{\Sigma}$ $\DeclareMathOperator*{\sprod}{\Pi}$

イントロ

代表的な分布の性質を解説します。
今回は超幾何分布です。


スポンサーリンク

定義

超幾何分布は3つのパラメータ$N,M,n$をとり、全部で$N$個のくじのうち、アタリが$M$個、ハズレが$N-M$個ある場合に、$n$個のくじを引いた中にあるアタリのくじの個数の確率を求めるのに利用します。
この超幾何分布を$HG(N,M,n)$と書いたりします。
確率関数は、$X \sim HG(N,M,n)$として、

\begin{align}
P(X=k) = \begin{cases}\cfrac{ \displaystyle \binom{M}{k} \binom{N-M}{n-k}}{ \displaystyle \binom{N}{n}} & (k=0,1,\cdots,n) \\
0&(\text{others})
\end{cases}
\end{align}

と表されます。

期待値

定義通りに計算します。
途中で$\binom{a}{b} = \frac{a}{b}\binom{a-1}{b-1}$を用います。

\begin{align}
&E(X) \\
&= \sum_{k=0}^n k \times P(X=k)\\
&=\sum_{k=0}^n k \times \binom{M}{k} \binom{N-M}{n-k}\bigg/ \binom{N}{n}\\
&=\sum_{k=0}^n k \times \frac{M}{k}\binom{M-1}{k-1} \binom{N-M}{n-k} \bigg/ \frac{N}{n}\binom{N-1}{n-1}\\
&=n\frac{M}{N}\sum_{k=1}^n \binom{M-1}{k-1} \binom{N-M}{n-k} \bigg/ \binom{N-1}{n-1}\\
&=n\frac{M}{N} \sum_{k=1}^n \binom{M-1}{k-1} \binom{(N-1)-(M-1)}{(n-1)-(k-1)} \bigg/\binom{N-1}{n-1}\\
&(\text{Put } t \text{ as } k-1)\\
&=n\frac{M}{N} \underline{\sum_{t=0}^{n-1} \binom{M-1}{t} \binom{(N-1)-(M-1)}{(n-1)-t} \bigg/ \binom{N-1}{n-1}}\\
&= n\frac{M}{N}
\end{align}

最後の式の変形は、下線部が$HG(N-1,M-1,n-1)$の超幾何分布の全確率$1$となることを利用しました。

分散

$V(X)=E(X^2) – E(X)^2$を用いて計算します。
先ほど出てきた$HG(N-1,M-1,n-1)$に従う確率変数を$Y$とします。

\begin{align}
&E(X^2) \\
&= \sum_{k=0}^n k^2 \times P(X=k)\\
&=\sum_{k=0}^n k^2 \times \binom{M}{k} \binom{N-M}{n-k} \bigg/ \binom{N}{n}\\
&=\sum_{k=0}^n k^2 \times \frac{M}{k}\binom{M-1}{k-1} \binom{N-M}{n-k} \bigg/ \frac{N}{n}\binom{N-1}{n-1}\\
&=n\frac{M}{N}\sum_{k=1}^n k\times\binom{M-1}{k-1} \binom{N-M}{n-k}\bigg/ \binom{N-1}{n-1}\\
&=n\frac{M}{N} \sum_{k=1}^n k\times\binom{M-1}{k-1} \binom{(N-1)-(M-1)}{(n-1)-(k-1)}\bigg/ \binom{N-1}{n-1}\\
&(\text{Put } t \text{ as } k-1)\\
&=n\frac{M}{N} \sum_{t=0}^{n-1} (t+1)\binom{M-1}{t} \binom{(N-1)-(M-1)}{(n-1)-t}\bigg/ \binom{N-1}{n-1}\\
&= n\frac{M}{N} (E(Y) + 1)\\
&= n\frac{M}{N} \left((n-1)\frac{M-1}{N-1} + 1\right)
\end{align}

これから、
\begin{align}
V(X) &= E(X^2) – E(X)^2\\
&= n\frac{M}{N} \left((n-1)\frac{M-1}{N-1} + 1\right) – n^2\frac{M^2}{N^2}\\
&= n\frac{M}{N}\frac{N-M}{N}\frac{N-n}{N-1}
\end{align}

積率母関数

積率母関数は簡単な形では求められないようです。