数理統計:二項分布の性質

$\newcommand{\lnl}{\\[8pt]}$ $\newcommand{\Lnl}{\\[18pt]}$ $\newcommand{\delt}{\mathrm{d}}$ $\newcommand{\comb}{\mathrm{C}}$ $\DeclareMathOperator*{\ssum}{\Sigma}$ $\DeclareMathOperator*{\sprod}{\Pi}$

イントロ

代表的な分布の性質を解説します。
今回は二項分布です。


スポンサーリンク

定義

二項分布は2つのパラメータ$n,p$をとり、確率$p$でアタリ、確率$1-p$でハズレとなるくじを$n$回引いた際に、$k$回当たる確率を求めるのに利用します。
この二項分布を$B(n,p)$と書いたりします。
確率関数は、$X \sim B(n,p)$として、

\begin{align}
P(X=k) = \begin{cases} _{n}C_k p^k(1-p)^{n-k} & (k=0,1,\cdots,n) \\
0&(\text{others})
\end{cases}
\end{align}

と表されます。

期待値

定義通りに計算します。

\begin{align}
E(X) &= \sum_{k=0}^n k \times P(X=k)\\
&=\sum_{k=0}^n k \times _{n}C_k p^k(1-p)^{n-k}&&\\
&=\sum_{k=1}^n \cfrac{n!}{(k-1)!(n-k)!}p^k (1-p)^{n-k}\\
&(\text{Put } t \text{ as } k-1)\\
&=np \underline{\sum_{t=0}^{n-1} \cfrac{(n-1)!}{t!((n-1)-t)!} p^t (1-p)^{(n-1)-t}}\\
&=np
\end{align}

最後の式の変形は、下線部が$B(n-1,p)$の二項分布の全確率$1$となることを利用しました。

分散

$V(X)=E(X^2) – E(X)^2$を用いて計算します。

\begin{align}
E(X^2) &= \sum_{k=0}^n k^2 \times P(X=k)\\
&=\sum_{k=0}^n k^2 \times _{n}C_k p^k(1-p)^{n-k}&&\\
&=\sum_{k=1}^n \cfrac{k\cdot n!}{(k-1)!(n-k)!}p^k (1-p)^{n-k}\\
&(\text{Put } t \text{ as } k-1)\\
&=np \sum_{t=0}^{n-1} (t+1)\cfrac{(n-1)!}{t!((n-1)-t)!} p^t (1-p)^{(n-1)-t}\\
&(\text{Put } Y \sim B(n-1,p) )\\
&=np\left(E(Y) + \sum_{t=0}^{n-1}P(Y=t)\right)\\
&=np((n-1)p + 1)\\
&=(np)^2 + np(1-p)
\end{align}

これから、
\begin{align}
V(X) &= E(X^2) – E(X)^2\\
&= (np)^2 + np(1-p) – (np)^2\\
&= np(1-p)
\end{align}

積率母関数

定義通りに計算します。

\begin{align}
M_X(t) &= E\left(e^{tX}\right) \\
&= \sum_{k=0}^n e^{tk} {}_nC_k p^k (1-p)^{n-k}\\
&= \sum_{k=0}^n {}_nC_k (pe^{t})^k (1-p)^{n-k}\\
&=(pe^t +1 – p)^n
\end{align}

最後の変形は、$(x+y)^n = \sum_{i=0}^n {}_nC_i x^i y^{n-i}$を利用しました。

積率母関数を使って期待値と分散を求めると、

\begin{align}
E(X) &= M_X'(0)\\
&=n(pe^t + 1-p)^{n-1} \cdot pe^t |_{t=0}\\
&=np\\
E(X^2) &= M_X”(0)\\
&=n(n-1)(pe^t + 1-p)^{n-2} \cdot (pe^t)^2 \\
&\qquad + n(pe^t+1-p)^{n-1}\cdot pe^t |_{t=0}\\
&=(np)^2 + np(1-p)
\end{align}

となるので、$V(X)=E(X^2)-E(X)^2=np(1-p)$となります。