はじめに
「入門・演習 数理統計」の演習問題の自作解答を紹介します。
|
間違い等発見されましたらご指摘ください。
他の解答はこちらから。
なお、問題文は(必要がない限り)掲載しておりません。テキストを横に置いてご覧ください。
また、スマートフォン等では数式が画面からはみ出る場合があります。数式部分は横スクロールできます。
スポンサーリンク
$\newcommand{\lnl}{\\[8pt]}$ $\newcommand{\Lnl}{\\[18pt]}$ $\newcommand{\delt}{\mathrm{d}}$ $\newcommand{\comb}{\mathrm{C}}$ $\DeclareMathOperator*{\ssum}{\Sigma}$ $\DeclareMathOperator*{\sprod}{\Pi}$
ex4.B.3
問題について
本問は$F$の微分可能性や$f$の連続性の前提が抜けています.
前提として
「分布関数$F(x)$が$x=m$で微分可能で$F'(m) = f(m)$であり, $f$が$x=m$で連続」
という条件を付与して解答します.こうすることで解答にあるように$F'(m) = f(m)$や$F$の$x=m$の周りでのテーラー展開ができるようになります.
解答
簡単のため$n=2k+1$とする.$n=2k$の時も同様に示すことができる.
テキスト(4.3.5)より標本メジアンの確率密度関数$g(x)$は, $X$の分布関数を$F(x)$として,
\begin{align}
g(x) &= (2k+1)f(x)\binom{2k}{k}[F(x)]^k[1-F(x)]^k\lnl
&=(2k+1)\frac{(2k)!}{(k!)^2} f(x)[F(x)]^k[1-F(x)]^k\label{eq-4b3-0}
\end{align}
g(x) &= (2k+1)f(x)\binom{2k}{k}[F(x)]^k[1-F(x)]^k\lnl
&=(2k+1)\frac{(2k)!}{(k!)^2} f(x)[F(x)]^k[1-F(x)]^k\label{eq-4b3-0}
\end{align}
となる.
スターリングの公式より$N! \fallingdotseq \sqrt{2\pi N}N^N e^{-N}$なので,
\begin{align}
(2k+1)\frac{(2k)!}{(k!)^2} &= (2k+1)\frac{\sqrt{2\pi (2k)}(2k)^{2k} e^{-2k}}{(\sqrt{2\pi k}k^k e^{-k})^2}\lnl
&=\frac{(2k+1)4^k}{\sqrt{\pi k}}\label{eq-4b3-1}
\end{align}
(2k+1)\frac{(2k)!}{(k!)^2} &= (2k+1)\frac{\sqrt{2\pi (2k)}(2k)^{2k} e^{-2k}}{(\sqrt{2\pi k}k^k e^{-k})^2}\lnl
&=\frac{(2k+1)4^k}{\sqrt{\pi k}}\label{eq-4b3-1}
\end{align}
となる.また, $F(x)$を$x=m$の周りでテーラー展開する.$m$は中央値なので$F(m)=\cfrac{1}{2}$に注意すると,
\begin{align}
F(x) &= F(m) + F'(m)(x-m) + O\big((x-m)^2\big)\lnl
&=\frac{1}{2} + F'(m)(x-m) + O\big((x-m)^2\big)
\end{align}
F(x) &= F(m) + F'(m)(x-m) + O\big((x-m)^2\big)\lnl
&=\frac{1}{2} + F'(m)(x-m) + O\big((x-m)^2\big)
\end{align}
ここで$t = x-m$とおく. テーラー展開の誤差項が十分に小さくなるためには,$t$が十分小さくなる必要がある.
$k$が大きい場合に$t\to 0$つまり, $x\fallingdotseq m$であることを(補題1)にて示す.
$1-F(x)$も同様に計算すると,
\begin{align}
F(x) &=\frac{1}{2} + \Big(F'(m)t + O\big(t^2\big)\Big)\lnl
1-F(x) &=\frac{1}{2} – \Big(F'(m)t + O\big(t^2\big)\Big)\lnl
\end{align}
F(x) &=\frac{1}{2} + \Big(F'(m)t + O\big(t^2\big)\Big)\lnl
1-F(x) &=\frac{1}{2} – \Big(F'(m)t + O\big(t^2\big)\Big)\lnl
\end{align}
となるので,
\begin{align}
F(x)\big(1-F(x)\big) &= \left(\frac{1}{2}\right)^2 – \Big(F'(m)t + O\big(t^2\big)\Big)^2\lnl
&= \frac{1}{4} – \big(f(m)t\big)^2 + O\big(t^3\big)\label{eq-4b3-2}
\end{align}
F(x)\big(1-F(x)\big) &= \left(\frac{1}{2}\right)^2 – \Big(F'(m)t + O\big(t^2\big)\Big)^2\lnl
&= \frac{1}{4} – \big(f(m)t\big)^2 + O\big(t^3\big)\label{eq-4b3-2}
\end{align}
$\eqref{eq-4b3-1}$と$\eqref{eq-4b3-2}$を$\eqref{eq-4b3-0}$に代入して,
\begin{align}
g(x) &= \frac{(2k+1)4^kf(x)}{\sqrt{\pi k}}\left(\frac{1}{4} – \big(f(m)t\big)^2 + O\big(t^3\big)\right)^k\lnl
&= \frac{(2k+1)f(x)}{\sqrt{\pi k}}\left(1 – \frac{4k\big(f(m)t\big)^2}{k} + O\big(t^3\big)\right)^k
\end{align}
g(x) &= \frac{(2k+1)4^kf(x)}{\sqrt{\pi k}}\left(\frac{1}{4} – \big(f(m)t\big)^2 + O\big(t^3\big)\right)^k\lnl
&= \frac{(2k+1)f(x)}{\sqrt{\pi k}}\left(1 – \frac{4k\big(f(m)t\big)^2}{k} + O\big(t^3\big)\right)^k
\end{align}
ここで後述の(補題2)から$k$が大きいとき,
\begin{align}
\left(1 – \frac{4k\big(f(m)t\big)^2}{k} + O\big(t^3\big)\right)^k \fallingdotseq \exp(-4k(f(m)t)^2)
\end{align}
\left(1 – \frac{4k\big(f(m)t\big)^2}{k} + O\big(t^3\big)\right)^k \fallingdotseq \exp(-4k(f(m)t)^2)
\end{align}
であることを用いると,
\begin{align}
g(x) &\fallingdotseq \frac{(2k+1)f(x)}{\sqrt{\pi k}}\exp\left( -4k\big(f(m)t\big)^2\right)
\end{align}
g(x) &\fallingdotseq \frac{(2k+1)f(x)}{\sqrt{\pi k}}\exp\left( -4k\big(f(m)t\big)^2\right)
\end{align}
ここで, (補題1)から$f(x)\fallingdotseq f(m)$であることと,$n=2k+1\fallingdotseq 2k , t=x-m$を代入して,
\begin{align}
g(x) &\fallingdotseq \frac{nf(m)}{\sqrt{\pi \cfrac{n}{2}}}\exp\left( -2n\big(f(m)(x-m)\big)^2\right)\lnl
&= \frac{1}{\sqrt{\cfrac{2\pi}{4nf^2(m)}}}\exp\left( -\frac{(x-m)^2}{\left(\cfrac{2}{4nf^2(m)}\right)}\right)
\end{align}
g(x) &\fallingdotseq \frac{nf(m)}{\sqrt{\pi \cfrac{n}{2}}}\exp\left( -2n\big(f(m)(x-m)\big)^2\right)\lnl
&= \frac{1}{\sqrt{\cfrac{2\pi}{4nf^2(m)}}}\exp\left( -\frac{(x-m)^2}{\left(\cfrac{2}{4nf^2(m)}\right)}\right)
\end{align}
これは$\mathrm{N}\left(m,\cfrac{1}{4nf^2(m)}\right)$の確率密度関数であるので示された.
補題1
$k$が十分大きいとき, 標本メジアン$\overline{X}_n$が母集団メジアン$m$に限りなく近づく.
つまり,どんな正の数$c$に対しても,
\begin{align}
\lim_{k\to \infty} P(|\overline{X}_n – m| \ge c) =0 \label{eq-hodai-1}
\end{align}
\lim_{k\to \infty} P(|\overline{X}_n – m| \ge c) =0 \label{eq-hodai-1}
\end{align}
が成り立つ.
証明:
$\eqref{eq-hodai-1}$は,
\begin{align}
\lim_{k\to \infty} P(\overline{X}_n \le m-c) =0 \text{かつ} \lim_{k\to \infty} P(\overline{X}_n \ge m+c) =0
\end{align}
\lim_{k\to \infty} P(\overline{X}_n \le m-c) =0 \text{かつ} \lim_{k\to \infty} P(\overline{X}_n \ge m+c) =0
\end{align}
を示せばよい.ここでは前者だけを示す.(後者も同様に示すことができる)
標本メジアンの密度関数を$g(x)$とすると,
\begin{align}
g(x) \fallingdotseq \frac{(2k+1)4^kf(x)}{\sqrt{\pi k}}\big([F(x)][1-F(x)]\big)^k
\end{align}
g(x) \fallingdotseq \frac{(2k+1)4^kf(x)}{\sqrt{\pi k}}\big([F(x)][1-F(x)]\big)^k
\end{align}
である.$\big([F(x)][1-F(x)]\big)^k$を考える.$\theta = F(x)$とおき, $h(\theta)=\theta(1-\theta)$とおく. あきらかに$h(\theta)$を最大化する$theta=F(x)$が$\big([F(x)][1-F(x)]\big)^m$を最大化させる.簡単にわかるようにその値は$\theta=\cfrac{1}{2}$である.$\theta=F(x)$は単調だからこれを満たす$x$は$x=m$のみ.これは$x \le m-c$の範囲で$\big([F(x)][1-F(x)]\big)^k$を最大化させる$x$は$x=m-c$であることを意味している.
従って$x\le m-c$で
\begin{align}
\big([F(x)][1-F(x)]\big)^k \le \big([F(m-c)][1-F(m-c)]\big)^k \le \big([F(m)][1-F(m)]\big)^k = \frac{1}{4^k}
\end{align}
\big([F(x)][1-F(x)]\big)^k \le \big([F(m-c)][1-F(m-c)]\big)^k \le \big([F(m)][1-F(m)]\big)^k = \frac{1}{4^k}
\end{align}
$\cfrac{\alpha}{4} = F(m-c)$とおくと,上記は次のように書き換えられる.
\begin{align}
\big([F(x)][1-F(x)]\big)^k \le \left(\frac{\alpha}{4}\right)^k \le \frac{1}{4^k} \label{eq-f}
\end{align}
\big([F(x)][1-F(x)]\big)^k \le \left(\frac{\alpha}{4}\right)^k \le \frac{1}{4^k} \label{eq-f}
\end{align}
ここで,$\alpha< 1$に注意しておく.示したい式に戻ると,
\begin{align}
P(\overline{X}_n \le m-c) &= \int_{-\infty}^{m-c} g(x) \delt x\lnl
&\fallingdotseq \int_{-\infty}^{m-c} \frac{(2k+1)4^kf(x)}{\sqrt{\pi k}}\big([F(x)][1-F(x)]\big)^k \delt x\lnl
&< \frac{(2k)4^k}{\sqrt{k}} \int_{-\infty}^{m-c} f(x)\big([F(x)][1-F(x)]\big)^k \delt x
\end{align}
最後の不等式は$m$が大きいときに, $2k > \cfrac{2k+1}{\sqrt{\pi}}$が成立することを用いた.さらに$\eqref{eq-f}$を用いると,\begin{align}
P(\overline{X}_n \le m-c) &< \frac{(2k)4^k}{\sqrt{k}} \int_{-\infty}^{m-c} f(x) \left(\frac{\alpha}{4}\right)^k \delt x\lnl &< \frac{(2k)4^k}{\sqrt{k}} \left(\frac{\alpha}{4}\right)^k \int_{-\infty}^{m-c} f(x) \delt x\lnl &< 2\alpha^k\sqrt{k} \int_{-\infty}^{m} f(x) \delt x\lnl \end{align}
仮定より最後の積分は$F(m)=\cfrac{1}{2}$に等しいから,
P(\overline{X}_n \le m-c) &< \frac{(2k)4^k}{\sqrt{k}} \int_{-\infty}^{m-c} f(x) \left(\frac{\alpha}{4}\right)^k \delt x\lnl &< \frac{(2k)4^k}{\sqrt{k}} \left(\frac{\alpha}{4}\right)^k \int_{-\infty}^{m-c} f(x) \delt x\lnl &< 2\alpha^k\sqrt{k} \int_{-\infty}^{m} f(x) \delt x\lnl \end{align}
\begin{align}
P(\overline{X}_n \le m-c) < \alpha^k\sqrt{k}
\end{align}
この右辺は$k\to \infty$のとき$0$となるので示された.
補題2
$k$が十分大きいとき,(補題1から$t$が十分小さいとき)
\begin{align}
\left(1 – \frac{4k\big(f(m)t\big)^2}{k} + O\big(t^3\big)\right)^k \fallingdotseq \exp(-4k(f(m)t)^2)
\end{align}
\left(1 – \frac{4k\big(f(m)t\big)^2}{k} + O\big(t^3\big)\right)^k \fallingdotseq \exp(-4k(f(m)t)^2)
\end{align}
となる.
証明:
\begin{align}
\left(1 – \frac{4k\big(f(m)t\big)^2}{k} + O\big(t^3\big)\right)^k = \exp\big(k\log(1- 4(f(m)t)^2 + O(t^3))\big)
\end{align}
\left(1 – \frac{4k\big(f(m)t\big)^2}{k} + O\big(t^3\big)\right)^k = \exp\big(k\log(1- 4(f(m)t)^2 + O(t^3))\big)
\end{align}
ここで,$\log(1-x)$のテーラー展開から,
\begin{align}
\log(1-x) = -x + O(x^2)
\end{align}
\log(1-x) = -x + O(x^2)
\end{align}
であるので,
\begin{align}
\left(1 – \frac{4k\big(f(m)t\big)^2}{k} + O\big(t^3\big)\right)^k &= \exp\big(-k\cdot 4(f(m)t)^2 + O(kt^3)\big) \lnl
&= \exp\left(-4k(f(m)t)^2\right)\cdot \exp(O(mt^3))
\end{align}
\left(1 – \frac{4k\big(f(m)t\big)^2}{k} + O\big(t^3\big)\right)^k &= \exp\big(-k\cdot 4(f(m)t)^2 + O(kt^3)\big) \lnl
&= \exp\left(-4k(f(m)t)^2\right)\cdot \exp(O(mt^3))
\end{align}
(補題1)より$k\to \infty$のとき$t\to 0, mt^3\to 0 $なので, $\exp\big(O(mt^3)\big)\to 1$となり示された.
参考
Course Notes for Math 162: Mathematical Statistics The Sample Distribution of the Median(Adam Merberg and Steven J. Miller 2008) PDF
別解
サンプル分位数の極限分布については, 次が成り立つことから今回の結果が直ちに導けます.
$0 < p < 1$とし, 確率分布関数$F$が密度関数$f$を$Q_p$の近傍で持ち, $f$が$Q_p$で正であり連続ならば,
となる.
\begin{align}
\hat{Q}_{pn} \xrightarrow{d} \mathrm{N}\left(Q_p,\frac{p(1-p)}{f(Q_p)^2n}\right)
\end{align}
\hat{Q}_{pn} \xrightarrow{d} \mathrm{N}\left(Q_p,\frac{p(1-p)}{f(Q_p)^2n}\right)
\end{align}
となる.
上記の証明については別記事を書きましたのでご覧ください.