ex6.B.1 F分布と二項分布の関係とそれを用いたベルヌーイ分布のパラメータの信頼区間

はじめに

「入門・演習 数理統計」の演習問題の自作解答を紹介します。

[商品価格に関しましては、リンクが作成された時点と現時点で情報が変更されている場合がございます。]

入門・演習数理統計 [ 野田一雄 ]
価格:3780円(税込、送料無料) (2018/4/3時点)



間違い等発見されましたらご指摘ください。
他の解答はこちらから。
なお、問題文は(必要がない限り)掲載しておりません。テキストを横に置いてご覧ください。

また、スマートフォン等では数式が画面からはみ出る場合があります。数式部分は横スクロールできます。



スポンサーリンク


$\newcommand{\lnl}{\\[8pt]}$ $\newcommand{\Lnl}{\\[18pt]}$ $\newcommand{\delt}{\mathrm{d}}$ $\newcommand{\comb}{\mathrm{C}}$ $\DeclareMathOperator*{\ssum}{\Sigma}$ $\DeclareMathOperator*{\sprod}{\Pi}$

ex6.B.1

(i)

前半部分の証明

$F$分布の確率密度関数$f_{n_1,n_2}(x)$は,

\begin{align}
f_{n_1,n_2}(x) = \frac{\Gamma\left(\cfrac{n_1 + n_2}{2}\right)}{\Gamma\left(\cfrac{n_1}{2}\right)\Gamma\left(\cfrac{n_2}{2}\right)} {n_1}^{\frac{n_1}{2}}{n_2}^{\frac{n_2}{2}}\frac{x^{\frac{n_1}{2}-1}}{(n_1x + n_2)^\frac{n_1+n_2}{2}}
\end{align}

である.与えられた式を代入して,
\begin{align}
&\Gamma\left(\cfrac{n_1 + n_2}{2}\right) = \Gamma\left(\cfrac{2(k+1)+2(n-k)}{2}\right) = \Gamma(n+1) = n!\lnl
&\Gamma\left(\cfrac{n_1}{2}\right) = \Gamma\left(\cfrac{2(k+1)}{2}\right) = \Gamma(k+1) = k!\lnl
&\Gamma\left(\cfrac{n_2}{2}\right) = \Gamma\left(\cfrac{2(n-k)}{2}\right) = \Gamma(n-k) = (n-k-1)!
\end{align}

である.従って,
\begin{align}
\frac{\Gamma\left(\cfrac{n_1 + n_2}{2}\right)}{\Gamma\left(\cfrac{n_1}{2}\right)\Gamma\left(\cfrac{n_2}{2}\right)} = \frac{n!}{k!(n-k-1)!}
\end{align}

となる.この式を$H(n,k)$とおく.

次に$t=\cfrac{n_2}{n_1 x + n_2}$とおくと,

\begin{align}
&x = \frac{n_2}{n_1}\frac{1-t}{t} \label{eq-6b1-1}\lnl
&\frac{\delt t}{\delt x} = – \frac{n_1 n_2}{(n_1x + n_2)^2} = -\frac{n_1}{n_2}t^2\lnl
\Longrightarrow & \delt x = -\frac{n_2}{n_1}t^{-2} \delt t
\end{align}

である.また,
\begin{align}
\frac{x^{\frac{n_1}{2}-1}}{(n_1x + n_2)^\frac{n_1+n_2}{2}} &=\frac{x^{k}}{(n_1x + n_2)^{n+1}}\lnl
&= \frac{x^{k}}{{n_2}^{n+1}} \left(\frac{n_2}{n_1x + n_2}\right)^{n+1}\lnl
&= \frac{1}{{n_2}^{n+1}} \left(\frac{n_2}{n_1}\frac{1-t}{t}\right)^k t^{n+1}\lnl
&= {n_1}^{-k}{n_2}^{k-n-1} (1-t)^k t^{n-k+1}
\end{align}

であり,$x$が$c_1$から$\infty$へ動くとき,
\begin{align}
&\left.\cfrac{n_2}{n_1 x + n_2}\right|_{x=c_1} = 1-p\lnl
&\left.\cfrac{n_2}{n_1 x + n_2}\right|_{x\to \infty} = 0
\end{align}

となる.
従って,
\begin{align}
\int_{c_1}^\infty &f_{n_1,n_2}(x) \delt x \lnl
&= \int_{1-p}^{0} H(n,k){n_1}^\frac{n_1}{2} {n_2}^\frac{n_2}{2}\cdot {n_1}^{-k}{n_2}^{k-n-1} (1-t)^k t^{n-k+1} \cdot \left(-\frac{n_2}{n_1}t^{-2}\right)\delt t\lnl
&= \int_0^{1-p}H(n,k){n_1}^{k+1-k-1}{n_2}^{n-k-k-n-1+1}t^{n-k+1-2}(1-t)^k\delt t\lnl
&= \int_0^{1-p}H(n,k)t^{n-k-1}(1-t)^{k} \delt t
\end{align}

この最後の式を$I_k$とおく.部分積分により,
\begin{align}
I_k &= H(n,k)\left[\frac{1}{n-k}t^{n-k}(1-t)^k\right]_0^{1-p} \\
&\qquad+ H(n,k)\int_0^{1-p}\frac{k}{n-k}t^{n-k}(1-t)^{k-1}\delt t\lnl
&= \binom{n}{k}p^k(1-p)^{n-k} + I_{k-1}
\end{align}

この漸化式を解くために$I_0$を計算すると,
\begin{align}
I_0 = n\int_0^{1-p} t^{n-1}\delt t = \binom{n}{0}p^0(1-p)^{n-0}
\end{align}

なので,
\begin{align}
I_k = \sum_{j=0}^k \binom{n}{j}p^j(1-p)^{n-j}
\end{align}

となり題意が示された.

後半部分の証明

概ね前半と同等であるため, 細かい計算は省いて示す.

$F$分布の確率密度関数$f_{m_1,m_2}(x)$は,

\begin{align}
f_{m_1,m_2}(x) = \frac{\Gamma\left(\cfrac{m_1 + m_2}{2}\right)}{\Gamma\left(\cfrac{m_1}{2}\right)\Gamma\left(\cfrac{m_2}{2}\right)} {m_1}^{\frac{m_1}{2}}{m_2}^{\frac{m_2}{2}}\frac{x^{\frac{m_1}{2}-1}}{(m_1x + m_2)^\frac{m_1+m_2}{2}}
\end{align}

である.与えられた式を代入して,
\begin{align}
&\Gamma\left(\cfrac{m_1 + m_2}{2}\right) = n!\lnl
&\Gamma\left(\cfrac{m_1}{2}\right) = (n-k)! ,\quad \Gamma\left(\cfrac{m_2}{2}\right) = (k-1)!
\end{align}

である.従って,
\begin{align}
\frac{\Gamma\left(\cfrac{m_1 + m_2}{2}\right)}{\Gamma\left(\cfrac{m_1}{2}\right)\Gamma\left(\cfrac{m_2}{2}\right)} = \frac{n!}{(k-1)!(n-k)!}
\end{align}

となる.この式を$H(n,k)$とおく.

次に$t=\cfrac{m_2}{m_1 x + m_2}$とおくと,

\begin{align}
&x = \frac{m_2}{m_1}\frac{1-t}{t}\lnl
&\frac{\delt t}{\delt x} = -\frac{m_1}{m_2}t^2\Longrightarrow \delt x = -\frac{m_2}{m_1}t^{-2} \delt t
\end{align}

である.また,
\begin{align}
\frac{x^{\frac{m_1}{2}-1}}{(m_1x + m_2)^\frac{m_1+m_2}{2}} &=\frac{x^{n-k}}{(m_1x +m_2)^{n+1}}\lnl
&= \frac{x^{n-k}}{{m_2}^{n+1}} \left(\frac{m_2}{m_1x + m_2}\right)^{n+1}\lnl
&= \frac{1}{{m_2}^{n+1}} \left(\frac{m_2}{m_1}\frac{1-t}{t}\right)^{n-k} t^{n+1}\lnl
&= {m_1}^{k-n}{m_2}^{n-k-n-1} (1-t)^{n-k} t^{n+1-n+k}\lnl
&= {m_1}^{k-n}{m_2}^{-k-1} (1-t)^{n-k} t^{k+1}\lnl
\end{align}

であり,$x$が$c_2$から$\infty$へ動くとき,
\begin{align}
&\left.\cfrac{m_2}{m_1 x + m_2}\right|_{x=c_2} = p \quad , \left.\cfrac{m_2}{m_1 x + m_2}\right|_{x\to \infty} = 0
\end{align}

となる.
従って,
\begin{align}
\int_{c_2}^\infty f_{m_1,m_2}(x) \delt x
&= \int_0^{1-p}H(n,k)t^{k-1}(1-t)^{n-k} \delt t
\end{align}

この右辺を$I_k$とおく.部分積分により,
\begin{align}
I_k &= \binom{n}{k}p^k(1-p)^{n-k} + I_{k+1}
\end{align}

この漸化式を解くために$I_n$を計算すると,
\begin{align}
I_n = n\int_0^{p} t^{n-1}\delt t = \binom{n}{n}p^n(1-p)^{n-n}
\end{align}

なので,
\begin{align}
I_k = \sum_{j=k}^n \binom{n}{j}p^j(1-p)^{n-j}
\end{align}

となり題意が示された.

(ii)

\begin{align}
S = X_1+X_2+\cdots+X_n
\end{align}

とすると, $S$はパラメータ$n,p$の二項分布に従う.$S$の実現値$k$に対して,
\begin{align}
P_p\left(S \le k \right) \le \frac{\alpha}{2}\text{ かつ }P_p\left(S \ge k \right) \le \frac{\alpha}{2} \label{eq-6b1-3}
\end{align}

となるような範囲の$p$を求めれば信頼区間が求まる.前者の式は,
\begin{align}
P_p(S\le k ) = \sum_{j=0}^{k} \binom{n}{j}p^j(1-p)^{n-j}
\end{align}

であるから,(i)より$n_1 = 2(k+1) , n_2=2(n-k)$とおけば,
\begin{align}
P_p(S\le k ) = P\left(F_{n_1,n_2} \ge \frac{n_2p}{n_1(1-p)}\right)
\end{align}

である.従って,
\begin{align}
F_{n_1,n_2,\frac{\alpha}{2}} \ge \frac{n_2p}{n_1(1-p)} \label{eq-6b1-4}
\end{align}

となるような範囲の$p$で,
\begin{align}
P_p(S \le k ) \le \frac{\alpha}{2}
\end{align}

となる.$\eqref{eq-6b1-4}$を$p$について解くと,
\begin{align}
p \le \frac{n_1 F_{n_1,n_2,\frac{\alpha}{2}} }{n_1F_{n_1,n_2,\frac{\alpha}{2}} + n_2}
\end{align}

となる.

また, $\eqref{eq-6b1-3}$の後者の式は,

\begin{align}
P_p(S\ge k ) = \sum_{j=k}^{n} \binom{n}{j}p^j(1-p)^{n-j}
\end{align}

であるから,(i)より$m_1 = 2(n-k+1) , m_2=2k$とおけば,
\begin{align}
P_p(S\ge k ) = P\left(F_{m_1,m_2} \ge \frac{m_2(1-p)}{m_1p}\right)
\end{align}

である.
\begin{align}
F_{m_1,m_2,\frac{\alpha}{2}} \ge \frac{m_2(1-p)}{m_1p} \label{eq-6b1-2}
\end{align}

となるような範囲の$p$で,
\begin{align}
P_p(S \ge k ) \le \frac{\alpha}{2}
\end{align}

となる.$\eqref{eq-6b1-2}$を$p$について解くと,
\begin{align}
\frac{m_2}{m_1F_{m_1,m_2,\frac{\alpha}{2}} + m_2} \le p
\end{align}

となる.

従って,求める$100(1-\alpha)$%信頼区間は,

\begin{align}
\left[\frac{m_2}{m_1F_{m_1,m_2,\frac{\alpha}{2}} + m_2} , \frac{n_1 F_{n_1,n_2,\frac{\alpha}{2}} }{n_1F_{n_1,n_2,\frac{\alpha}{2}} + n_2} \right]
\end{align}

となり題意が示された.