ex5.3.3 多項分布が指数型分布族であることの証明

はじめに

「入門・演習 数理統計」の演習問題の自作解答を紹介します。

[商品価格に関しましては、リンクが作成された時点と現時点で情報が変更されている場合がございます。]

入門・演習数理統計 [ 野田一雄 ]
価格:3780円(税込、送料無料) (2018/4/3時点)



間違い等発見されましたらご指摘ください。
他の解答はこちらから。
なお、問題文は(必要がない限り)掲載しておりません。テキストを横に置いてご覧ください。

また、スマートフォン等では数式が画面からはみ出る場合があります。数式部分は横スクロールできます。



スポンサーリンク


$\newcommand{\lnl}{\\[8pt]}$ $\newcommand{\Lnl}{\\[18pt]}$ $\newcommand{\delt}{\mathrm{d}}$ $\newcommand{\comb}{\mathrm{C}}$ $\DeclareMathOperator*{\ssum}{\Sigma}$ $\DeclareMathOperator*{\sprod}{\Pi}$

ex5.3.3

多項分布は試行回数$n$と, 各項の確率$\bm{p} = (p_1,p_2,\cdots,p_k)$の$k+1$個のパラメータを持つ.
ここでは, $n$は既知 , $\bm{p}$は全て未知とする.

集合$A$に対して, $I_{A}(x_1,x_2,\cdots,x_k)$を,

\begin{align}
I_A(\bm{x}) = \begin{cases} 1 & \text{すべての}x_i\text{が} x_i \in A\\ 0 & \text{その他}\end{cases}
\end{align}

で定義する.
また,
\begin{align}
&\mathbb{N} = \{n; n=0,1,2,\cdots\}\\
&\mathbb{N}(a,b) = \{n; n\in \mathbb{N} , a \le n \le b \}\\
\end{align}

と定義する.

確率関数$f(x;\bm{p})$が,

\begin{align}
f(x;\bm{p} ) = h(x)\exp\left(\sum_{i=1}^k c_i(\bm{p})\cdot T_i(x) + d(\bm{p})\right)
\end{align}

となるように$h(x) , c_i(\bm{p}) ,T_i(x) , d(\bm{p})$を定められればよい.

多項分布の確率関数$f(\bm{x};\bm{p}) , \bm{x} = (x_1,x_2,\cdots ,x_k)$は,

\begin{align}
f(\bm{x};\bm{p}) =\frac{n!}{{x_1}!{x_2}!\cdots{x_k}!}{p_1}^{x_1}{p_2}^{x_2}\cdots{p_k}^{x_k} \cdot I_{\mathbb{N}(0,n)}(\bm{x})\cdot I_{\{n\}}\left(\sum_{i=1}^k x_i\right)
\end{align}

となる.変形して,
\begin{align}
f(\bm{x};\bm{p}) = I_{\mathbb{N}(0,n)}(\bm{x})\cdot I_{\{n\}}\left(\sum_{i=1}^k x_i\right) \frac{n!}{{x_1}!{x_2}!\cdots{x_k}!} \exp\left(\sum_{i=1}^k \big(\log p_i\big)\cdot x_i\right)
\end{align}

となる.
\begin{align}
&h(x) = I_{\mathbb{N}(0,n)}(\bm{x})\cdot I_{\{n\}}\left(\sum_{i=1}^k x_i\right) \frac{n!}{{x_1}!{x_2}!\cdots{x_k}!},\\
& d(\bm{p}) = 0,\\
&c_i(\bm{p}) = \log p_i ,\qquad T_i(x) = x_i\\
&(i = 1,2,\cdots,k )
\end{align}

とすればよいから, $k$パラメータの指数型分布族となる.

別解

パラメータ$\bm{p}$を$\bm{p} = (p_1,p_2,\cdots,p_{k-1})$とし,
$p_k = 1- p_1-p_2-\cdots-p_{k-1}$と考えた時の確率密度関数は,

\begin{align}
f(\bm{x};\bm{p}) &= I_{\mathbb{N}(0,n)}(\bm{x})\cdot I_{\{n\}}\left(\sum_{i=1}^k x_i\right) \frac{n!}{{x_1}!{x_2}!\cdots{x_k}!} \lnl
&\quad \times\exp\left(\sum_{i=1}^{k-1} \big(\log p_i\big)\cdot x_i +\log(1-p_1-p_2-\cdots-p_{k-1})x_k \right)
\end{align}

となる.このとき,
\begin{align}
&h(x) = I_{\mathbb{N}(0,n)}(\bm{x})\cdot I_{\{n\}}\left(\sum_{i=1}^k x_i\right) \frac{n!}{{x_1}!{x_2}!\cdots{x_k}!},\\
& d(\bm{p}) = 0,\\
&c_i(\bm{p}) = \log p_i , && T_i(x) = x_i\\
&(i = 1,2,\cdots,k-1 )\\
&c_k(\bm{p}) = \log (1-p_1-p_2-\cdots-p_{k-1}) , && T_k(x) = x_k
\end{align}

とすればよいから, 結局$k$パラメータの指数型分布族となる.

$n,\bm{p}$が未知の場合

この場合は指数型分布族になりません.
確率関数にある$I_{\mathbb{N}(0,n)}(\bm{x})$の項は$n$に依存しますが,$0$をとりうるので$\exp(\log I_{\mathbb{N}(0,n)}(\bm{x}))$の形に変形することができません.