ex4.B.3 標本メジアンの極限分布が正規分布に収束することの証明

はじめに

「入門・演習 数理統計」の演習問題の自作解答を紹介します。

[商品価格に関しましては、リンクが作成された時点と現時点で情報が変更されている場合がございます。]

入門・演習数理統計 [ 野田一雄 ]
価格:3780円(税込、送料無料) (2018/4/3時点)



間違い等発見されましたらご指摘ください。
他の解答はこちらから。
なお、問題文は(必要がない限り)掲載しておりません。テキストを横に置いてご覧ください。

また、スマートフォン等では数式が画面からはみ出る場合があります。数式部分は横スクロールできます。



スポンサーリンク


$\newcommand{\lnl}{\\[8pt]}$ $\newcommand{\Lnl}{\\[18pt]}$ $\newcommand{\delt}{\mathrm{d}}$ $\newcommand{\comb}{\mathrm{C}}$ $\DeclareMathOperator*{\ssum}{\Sigma}$ $\DeclareMathOperator*{\sprod}{\Pi}$

ex4.B.3

問題について

本問は$F$の微分可能性や$f$の連続性の前提が抜けています.

前提として
「分布関数$F(x)$が$x=m$で微分可能で$F'(m) = f(m)$であり, $f$が$x=m$で連続」
という条件を付与して解答します.こうすることで解答にあるように$F'(m) = f(m)$や$F$の$x=m$の周りでのテーラー展開ができるようになります.

解答

簡単のため$n=2k+1$とする.$n=2k$の時も同様に示すことができる.
テキスト(4.3.5)より標本メジアンの確率密度関数$g(x)$は, $X$の分布関数を$F(x)$として,

\begin{align}
g(x) &= (2k+1)f(x)\binom{2k}{k}[F(x)]^k[1-F(x)]^k\lnl
&=(2k+1)\frac{(2k)!}{(k!)^2} f(x)[F(x)]^k[1-F(x)]^k\label{eq-4b3-0}
\end{align}

となる.
スターリングの公式より$N! \fallingdotseq \sqrt{2\pi N}N^N e^{-N}$なので,
\begin{align}
(2k+1)\frac{(2k)!}{(k!)^2} &= (2k+1)\frac{\sqrt{2\pi (2k)}(2k)^{2k} e^{-2k}}{(\sqrt{2\pi k}k^k e^{-k})^2}\lnl
&=\frac{(2k+1)4^k}{\sqrt{\pi k}}\label{eq-4b3-1}
\end{align}

となる.また, $F(x)$を$x=m$の周りでテーラー展開する.$m$は中央値なので$F(m)=\cfrac{1}{2}$に注意すると,
\begin{align}
F(x) &= F(m) + F'(m)(x-m) + O\big((x-m)^2\big)\lnl
&=\frac{1}{2} + F'(m)(x-m) + O\big((x-m)^2\big)
\end{align}

ここで$t = x-m$とおく. テーラー展開の誤差項が十分に小さくなるためには,$t$が十分小さくなる必要がある.
$k$が大きい場合に$t\to 0$つまり, $x\fallingdotseq m$であることを(補題1)にて示す.
$1-F(x)$も同様に計算すると,
\begin{align}
F(x) &=\frac{1}{2} + \Big(F'(m)t + O\big(t^2\big)\Big)\lnl
1-F(x) &=\frac{1}{2} – \Big(F'(m)t + O\big(t^2\big)\Big)\lnl
\end{align}

となるので,
\begin{align}
F(x)\big(1-F(x)\big) &= \left(\frac{1}{2}\right)^2 – \Big(F'(m)t + O\big(t^2\big)\Big)^2\lnl
&= \frac{1}{4} – \big(f(m)t\big)^2 + O\big(t^3\big)\label{eq-4b3-2}
\end{align}

$\eqref{eq-4b3-1}$と$\eqref{eq-4b3-2}$を$\eqref{eq-4b3-0}$に代入して,
\begin{align}
g(x) &= \frac{(2k+1)4^kf(x)}{\sqrt{\pi k}}\left(\frac{1}{4} – \big(f(m)t\big)^2 + O\big(t^3\big)\right)^k\lnl
&= \frac{(2k+1)f(x)}{\sqrt{\pi k}}\left(1 – \frac{4k\big(f(m)t\big)^2}{k} + O\big(t^3\big)\right)^k
\end{align}

ここで後述の(補題2)から$k$が大きいとき,
\begin{align}
\left(1 – \frac{4k\big(f(m)t\big)^2}{k} + O\big(t^3\big)\right)^k \fallingdotseq \exp(-4k(f(m)t)^2)
\end{align}

であることを用いると,
\begin{align}
g(x) &\fallingdotseq \frac{(2k+1)f(x)}{\sqrt{\pi k}}\exp\left( -4k\big(f(m)t\big)^2\right)
\end{align}

ここで, (補題1)から$f(x)\fallingdotseq f(m)$であることと,$n=2k+1\fallingdotseq 2k , t=x-m$を代入して,
\begin{align}
g(x) &\fallingdotseq \frac{nf(m)}{\sqrt{\pi \cfrac{n}{2}}}\exp\left( -2n\big(f(m)(x-m)\big)^2\right)\lnl
&= \frac{1}{\sqrt{\cfrac{2\pi}{4nf^2(m)}}}\exp\left( -\frac{(x-m)^2}{\left(\cfrac{2}{4nf^2(m)}\right)}\right)
\end{align}

これは$\mathrm{N}\left(m,\cfrac{1}{4nf^2(m)}\right)$の確率密度関数であるので示された.

補題1

$k$が十分大きいとき, 標本メジアン$\overline{X}_n$が母集団メジアン$m$に限りなく近づく.
つまり,どんな正の数$c$に対しても,

\begin{align}
\lim_{k\to \infty} P(|\overline{X}_n – m| \ge c) =0 \label{eq-hodai-1}
\end{align}

が成り立つ.

証明:

$\eqref{eq-hodai-1}$は,

\begin{align}
\lim_{k\to \infty} P(\overline{X}_n \le m-c) =0 \text{かつ} \lim_{k\to \infty} P(\overline{X}_n \ge m+c) =0
\end{align}

を示せばよい.ここでは前者だけを示す.(後者も同様に示すことができる)

標本メジアンの密度関数を$g(x)$とすると,

\begin{align}
g(x) \fallingdotseq \frac{(2k+1)4^kf(x)}{\sqrt{\pi k}}\big([F(x)][1-F(x)]\big)^k
\end{align}

である.$\big([F(x)][1-F(x)]\big)^k$を考える.$\theta = F(x)$とおき, $h(\theta)=\theta(1-\theta)$とおく. あきらかに$h(\theta)$を最大化する$theta=F(x)$が$\big([F(x)][1-F(x)]\big)^m$を最大化させる.簡単にわかるようにその値は$\theta=\cfrac{1}{2}$である.$\theta=F(x)$は単調だからこれを満たす$x$は$x=m$のみ.これは$x \le m-c$の範囲で$\big([F(x)][1-F(x)]\big)^k$を最大化させる$x$は$x=m-c$であることを意味している.
従って$x\le m-c$で
\begin{align}
\big([F(x)][1-F(x)]\big)^k \le \big([F(m-c)][1-F(m-c)]\big)^k \le \big([F(m)][1-F(m)]\big)^k = \frac{1}{4^k}
\end{align}

$\cfrac{\alpha}{4} = F(m-c)$とおくと,上記は次のように書き換えられる.
\begin{align}
\big([F(x)][1-F(x)]\big)^k \le \left(\frac{\alpha}{4}\right)^k \le \frac{1}{4^k} \label{eq-f}
\end{align}

ここで,$\alpha< 1$に注意しておく.示したい式に戻ると,
\begin{align} P(\overline{X}_n \le m-c) &= \int_{-\infty}^{m-c} g(x) \delt x\lnl &\fallingdotseq \int_{-\infty}^{m-c} \frac{(2k+1)4^kf(x)}{\sqrt{\pi k}}\big([F(x)][1-F(x)]\big)^k \delt x\lnl &< \frac{(2k)4^k}{\sqrt{k}} \int_{-\infty}^{m-c} f(x)\big([F(x)][1-F(x)]\big)^k \delt x \end{align}
最後の不等式は$m$が大きいときに, $2k > \cfrac{2k+1}{\sqrt{\pi}}$が成立することを用いた.さらに$\eqref{eq-f}$を用いると,
\begin{align}
P(\overline{X}_n \le m-c) &< \frac{(2k)4^k}{\sqrt{k}} \int_{-\infty}^{m-c} f(x) \left(\frac{\alpha}{4}\right)^k \delt x\lnl &< \frac{(2k)4^k}{\sqrt{k}} \left(\frac{\alpha}{4}\right)^k \int_{-\infty}^{m-c} f(x) \delt x\lnl &< 2\alpha^k\sqrt{k} \int_{-\infty}^{m} f(x) \delt x\lnl \end{align}
仮定より最後の積分は$F(m)=\cfrac{1}{2}$に等しいから,
\begin{align} P(\overline{X}_n \le m-c) < \alpha^k\sqrt{k} \end{align}
この右辺は$k\to \infty$のとき$0$となるので示された.

補題2

$k$が十分大きいとき,(補題1から$t$が十分小さいとき)

\begin{align}
\left(1 – \frac{4k\big(f(m)t\big)^2}{k} + O\big(t^3\big)\right)^k \fallingdotseq \exp(-4k(f(m)t)^2)
\end{align}

となる.

証明:

\begin{align}
\left(1 – \frac{4k\big(f(m)t\big)^2}{k} + O\big(t^3\big)\right)^k = \exp\big(k\log(1- 4(f(m)t)^2 + O(t^3))\big)
\end{align}

ここで,$\log(1-x)$のテーラー展開から,
\begin{align}
\log(1-x) = -x + O(x^2)
\end{align}

であるので,
\begin{align}
\left(1 – \frac{4k\big(f(m)t\big)^2}{k} + O\big(t^3\big)\right)^k &= \exp\big(-k\cdot 4(f(m)t)^2 + O(kt^3)\big) \lnl
&= \exp\left(-4k(f(m)t)^2\right)\cdot \exp(O(mt^3))
\end{align}

(補題1)より$k\to \infty$のとき$t\to 0, mt^3\to 0 $なので, $\exp\big(O(mt^3)\big)\to 1$となり示された.

参考

Course Notes for Math 162: Mathematical Statistics The Sample Distribution of the Median(Adam Merberg and Steven J. Miller 2008) PDF

別解

サンプル分位数の極限分布については, 次が成り立つことから今回の結果が直ちに導けます.

$0 < p < 1$とし, 確率分布関数$F$が密度関数$f$を$Q_p$の近傍で持ち, $f$が$Q_p$で正であり連続ならば,
\begin{align}
\hat{Q}_{pn} \xrightarrow{d} \mathrm{N}\left(Q_p,\frac{p(1-p)}{f(Q_p)^2n}\right)
\end{align}

となる.

上記の証明については別記事を書きましたのでご覧ください.