有名不等式(シュワルツの不等式)

$\newcommand{\lnl}{\\[8pt]}$ $\newcommand{\Lnl}{\\[18pt]}$ $\newcommand{\delt}{\mathrm{d}}$ $\newcommand{\comb}{\mathrm{C}}$ $\DeclareMathOperator*{\ssum}{\Sigma}$ $\DeclareMathOperator*{\sprod}{\Pi}$

イントロ

統計検定(1級)でもたまに知識が必要な有名不等式をまとめます。
今回は、シュワルツの不等式について紹介します。

スポンサーリンク

いろいろなシュワルツの不等式

シュワルツの不等式はいろいろな形であらわれます。
ここでは4つの形を紹介します。

シュワルツの不等式(2数列バージョン)

2数列に関するシュワルツの不等式を紹介します。一番ポピュラーなものです。

シュワルツの不等式(2数列バージョン)
正の整数$n$に対し、実数列$\{a_i\} , \{b_i\} , i=1,2,\cdots,n$をとる。そのとき次の不等式が常に成立する。
\begin{align}
\left(\sum_{i=1}^{n} a_i b_i \right)^2 \le \left(\sum_{i=1}^{n} {a_i}^2\right)\left(\sum_{i=1}^{n} {b_i}^2\right)
\end{align}

等号成立は
\begin{align}
a_1:a_2:\cdots:a_n = b_1:b_2:\cdots:b_n
\end{align}

の場合に限る。

コーシー・シュワルツの不等式とも言ったりします。

証明

$t$を実変数、$1 \le i \le n$とすると、

\begin{align}(a_i – t b_i)^2 \ge 0\label{ineq-a}\end{align}

が成り立つ。
左辺を展開して$i=1$から$i=n$まで辺々足すと、
\begin{align}
\sum_{i=1}^{n} {a_i}^2 -2t\sum_{i=1}^n a_i b_i + t^2 \sum_{i=1}^{n} {b_i}^2 \ge 0
\end{align}

左辺を$t$に関する二次関数とみると、常に0以上(実数解を持たない、または重解を1個持つ)であるので、判別式$D$は0以下となる。
つまり、
\begin{align}
\frac{D}{4} = \left(\sum_{i=1}^n a_i b_i\right)^2 – \left(\sum_{i=1}^{n} {a_i}^2\right)\left(\sum_{i=1}^{n} {b_i}^2\right) \le 0
\end{align}

等号成立は全ての$i$で\eqref{ineq-a}が等号成立すること。すなわち、

\begin{align}
a_1:a_2:\cdots:a_n = b_1:b_2:\cdots:b_n
\end{align}

の場合に限る。

シュワルツの不等式(1数列バージョン)

1数列に関するシュワルツの不等式を紹介します。統計検定では、統計量の分散などの大小を比較するのに使うことがあります(2016年1級 統計数理 問3)

シュワルツの不等式(1数列バージョン)
正の整数$n$に対し、実数列$\{a_i\} , i=1,2,\cdots,n$をとる。そのとき次の不等式が常に成立する。
\begin{align}
\left(\sum_{i=1}^{n} a_i \right)^2 \le n \left(\sum_{i=1}^{n} {a_i}^2\right)
\end{align}

等号成立は
\begin{align}
a_1=a_2=\cdots=a_n
\end{align}

の場合に限る。

証明

2変数の場合の不等式に$b_1 = b_2 = \cdots = b_n = 1$を代入すれば直ちに求まります。

シュワルツの不等式(積分バージョン)

積分に関するシュワルツの不等式を紹介します。

シュワルツの不等式(積分バージョン)
任意の関数$f,g$と任意の区間$[a,b]$をとる。そのとき次の不等式が常に成立する。
\begin{align}
\left(\int_{a}^{b} f(x)^2 \mathrm{d}x\right)\left(\int_{a}^{b} g(x)^2 \mathrm{d}x\right) \ge \left(\int_{a}^{b} f(x)g(x) \mathrm{d}x\right)^2
\end{align}

等号成立は適当な$t$が存在し、任意の$x$に対して
\begin{align}
f(x) = tg(x)
\end{align}

と表せる場合に限る。

証明

実変数$t$とすると、

\begin{align}\int_{a}^{b} (f(x) – t g(x))^2\mathrm{d}x \ge 0\label{ineq-c}\end{align}

が成り立つ。
左辺を展開して、
\begin{align}
\int_{a}^{b}& (f(x) – t g(x))^2 \mathrm{d}x\\
&= \left(\int_{a}^{b} g(x)^2 \mathrm{d}x\right)t^2 -\left(2 \int_{a}^{b} f(x)g(x) \mathrm{d}x\right) t +\int_{a}^{b} f(x)^2 \mathrm{d}x
\end{align}

これを$t$の二次関数と考えると、$0$以上、つまり判別式$D \le0$となる、すなわち
\begin{align}
\frac{D}{4} = \int_{a}^{b} f(x)g(x) \mathrm{d}x – \left(\int_{a}^{b} g(x)^2 \mathrm{d}x\right)\left(\int_{a}^{b} f(x)^2 \mathrm{d}x \right) \le 0
\end{align}

となるので示された。
等号成立は、$\eqref{ineq-c}$で等号が成立する場合、すなわち$f(x)=t g(x)$となる場合に限る。

シュワルツの不等式(期待値バージョン)

2つの確率変数の期待値に関する不等式です。

シュワルツの不等式(期待値バージョン)
確率変数$X,Y$に対して、期待値$E\left(X^2\right),E\left(Y^2\right)$が存在すれば、
\begin{align}
E(XY)^2 \le E\left(X^2\right)E\left(Y^2\right)
\end{align}

等号成立は適当な$t$が存在し、
\begin{align}
X = tY
\end{align}

と表せる場合に限る。

これはヘルダーの不等式の特別な場合です。

証明

2数列バージョンの証明に似ています。
$t$を実変数とすると、

\begin{align}E[(X-tY)^2] \ge 0\label{ineq-b}\end{align}

が成り立つ。
左辺を展開して、
\begin{align}
E[(X-tY)^2] &= E\left(Y^2\right) t^2 – 2E(XY)t + E\left(X^2\right) \ge 0
\end{align}

これを$t$に関する二次関数とみると、常に0以上(実数解を持たない、または重解を1個持つ)であるので、判別式$D$は0以下となる。
つまり、
\begin{align}
\frac{D}{4} = E(XY)^2 – E\left(X^2\right)E\left(Y^2\right) \le 0
\end{align}

となり示された。
等号成立は\eqref{ineq-b}で等号成立すること。すなわち、
\begin{align}
X = tY
\end{align}

の場合に限る。

シュワルツの不等式(分散・共分散バージョン)

2つの確率変数の分散・共分散に関する不等式です。

シュワルツの不等式(分散・共分散バージョン)
確率変数$X,Y$に対して、期待値$E\left(X^2\right),E\left(Y^2\right)$が存在すれば、
\begin{align}
\mathrm{Cov}(X,Y)^2 \le V(X) V(Y)
\end{align}

等号成立は
\begin{align}
X = tY
\end{align}

の場合に限る。

これは、相関係数の絶対値が1以下であることを示すのに使います。実際左辺を右辺(>0)で割れば相関係数の二乗が1以下であることが直ちにわかります。

証明

$\mu_X = E(X) , \mu_Y= E(Y)$とする。
$V=X-\mu_X , W=Y-\mu_Y$とおき、シュワルツの不等式(期待値バージョン)を使うと、

\begin{align}
E(VW) \le E\left(V^2\right)E\left(W^2\right)
\end{align}

ここで、
\begin{align}
E(VW) &= E[(X-\mu_X)(Y-\mu_Y)] = E(XY)-E(X)E(Y) = \mathrm{Cov}(X,Y)\\
E\left(V^2\right) &= E\left[(X-\mu_X)^2\right] = V(X)\\
E\left(W^2\right) &= E\left[(Y-\mu_Y)^2\right] = V(Y)
\end{align}

であるので、示された。
等号成立条件は、$V = tW \Rightarrow X = tY$となる。