第7章 ポアソン母集団Po(μ)の母平均の信頼区間と検定(p128)

記事の目的

明解演習 数理統計の勉強をしながら気づいた点を書いていきます。

[商品価格に関しましては、リンクが作成された時点と現時点で情報が変更されている場合がございます。]

明解演習数理統計 [ 小寺平治 ]
価格:2592円(税込、送料無料) (2018/4/3時点)


他の問題に関する記事はこちらから。
スマートフォンでの閲覧では数式が画面からはみ出る場合があります。必要に応じてPCモード等にしてご覧ください。

スポンサーリンク


$\newcommand{\lnl}{\\[8pt]}$ $\newcommand{\Lnl}{\\[18pt]}$ $\newcommand{\delt}{\mathrm{d}}$ $\newcommand{\comb}{\mathrm{C}}$ $\DeclareMathOperator*{\ssum}{\Sigma}$ $\DeclareMathOperator*{\sprod}{\Pi}$

第7章 ポアソン母集団$\mathrm{Po}(\mu)$の母平均の信頼区間と検定(p128)

ポアソン母集団$\mathrm{Po}(\mu)$の母平均の検定と信頼区間の導出

第7章の基本事項まとめに出てくる、「ポアソン母集団の母平均の検定と信頼区間」に記載の公式の導出を行います。

ポアソン母集団の場合の検定・推定をWebで検索してもテキストの公式ではなく「(大標本と考えて)正規分布で近似の上、検定する(または信頼区間を求める)」というものばかりヒットし、公式の導出にたどり着けませんでした。
正規分布の検定や推定の場合、ほとんどの教科書に導出が記載されており、各種前提条件によって、なぜ$\chi^2$検定を使うのか、$t$検定を使うのかということを理解することができましたが、ポアソン母集団に関しては理解が足りないと思ったので導出してみることにしました。

公式の導出

補題 ポアソン分布と$\chi^2$分布の関係

p187にある以下の事項を証明します。
$ X \sim Po(\lambda) , k \in \mathbb{N} , n = 2(k+1) , Y \sim \chi^2(n) $とすると、

\begin{align*}
P(X \le k) = P(Y\ge 2\lambda)
\end{align*}

証明:
ポアソン分布の確率関数$ P(X = i) = \cfrac{\lambda^i e^{-\lambda}}{i !} $から、

\begin{align*}
P(X \le k)
&= \sum_{i=0}^k \frac{\lambda^i e^{-\lambda}}{i !} \\
\end{align*}

一方、自由度$m$の$\chi^2$分布の累積分布関数は、$ F_m(x) =\cfrac{\gamma(m/2 , x/2)}{\Gamma(m/2)} $である。
ただし、$ \gamma $は第1種不完全ガンマ関数[1]

\begin{align*}
\therefore P(Y \ge 2\lambda)
&=1- P(Y < 2\lambda) \\
&=1- F_{n}(2\lambda) \\
&=1-F_{2(k+1)}(2\lambda) \lnl
&=1-\frac{\gamma(k+1,\lambda)}{\Gamma(k+1)} \lnl
&=1-\frac{k\gamma(k,\lambda) – \lambda^k e^{-\lambda}}{k!} \lnl
&=1+\frac{\lambda^k e^{-\lambda}}{k!}-\frac{\gamma(k,\lambda)}{(k-1)!} \lnl
&=1+\frac{\lambda^k e^{-\lambda}}{k!}+\cdots+\frac{\lambda^1 e^{-\lambda}}{1!} – \left(\frac{\gamma(1,\lambda)}{0!}\right) \lnl
&=1+\frac{\lambda^k e^{-\lambda}}{k!}+\cdots+\frac{\lambda^1 e^{-\lambda}}{1!} – (1-e^{-\lambda}) \lnl
&=\sum_{i=0}^k \frac{\lambda^i e^{-\lambda}}{i !}
\end{align*}

よって示された。
なお、途中の計算で以下の公式を使った。

\begin{align*}
&k \in \mathbb{N} \Rightarrow \Gamma(k+1) = k! \\
&\gamma(a+1,x) = a \gamma(a,x) – x^{a} e^{-x} \\
&\gamma(1,x) = (1-e^{-x})
\end{align*}

信頼区間

$ \lambda $の信頼区間の意味

ポアソン母分布から実現値$t$が得られたとき、信頼度$ 1- \alpha $で$ \lambda $の信頼区間を求めることは、次の$ \lambda_u , \lambda_l $に囲まれた区間を求めることをいう。[2]
ここで、$ Po_{\lambda}はPo(\lambda) $に従う確率変数を表す。

信頼区間の下限
$ P(Po_{\lambda} \ge t) = \alpha/2 \Leftrightarrow P(Po_{\lambda} \le t-1 ) = 1- \alpha/2 $となる$ \lambda = \lambda_l $

信頼区間の上限
$ P(Po_{\lambda} \le t ) = \alpha/2 $となる$ \lambda= \lambda_u $

信頼区間の導出

記号の定義

\begin{align*}
&t = x_1 + x_2 + \cdots + x_n \\
&Y_n\sim \chi^2 (n)
\end{align*}

とする。

また、ポアソン分布の再生性より$ n\bar{X} \sim Po(n\lambda) $である。
$ t$は$n\bar{X} $からの実現値であるため

\begin{align}
P(n\bar{X} \le t-1) =1- \alpha/2 \label{eq-p1}\\
P(n\bar{X} \le t) = \alpha/2\label{eq-p2}
\end{align}

を満たす$ \lambda_l,\lambda_u\ $を求めればよい。

$\eqref{eq-p1}$に補題を用いると、

\begin{align*}
&P(n\bar{X} \le t-1 ) = P(Y_{2t} \ge 2n\lambda) = 1-\alpha/2 \lnl
&\therefore \chi_{2t}^2(1-\alpha/2) = 2n\lambda_l \Leftrightarrow \frac{ \chi_{2t}^2(1-\alpha/2)}{2n} = \lambda_l \lnl
&\therefore \lambda_l = \frac{ \chi_{2t}^2(1-\alpha/2)}{2n}
\end{align*}

$\eqref{eq-p2}$も同様にして求めると信頼区間は、

\begin{align*}
\displaystyle \frac{ \chi_{2t}^2(1-\alpha/2)}{2n} \le \lambda \le \frac{ \chi_{2t+2}^2(\alpha/2)}{2n}
\end{align*}

となる。

仮説検定

$t$を改めて統計量$ T = n\bar{X} $として定義すると、棄却域は

\begin{align*}
T < \frac{ \chi_{2t}^2(1-\alpha/2)}{2n} ,\frac{ \chi_{2t+2}^2(\alpha/2)}{2n} < T \end{align*}
となる。 * 参考文献 [1]Wikipedia – 不完全ガンマ関数
[2]https://oku.edu.mie-u.ac.jp/~okumura/stat/what_is_CI.php
[3]Yahoo!知恵袋 ポアソン分布の母平均尾の信頼区間について。