by nkoda

【統計検定1級対策】正規分布(ガウス分布)の積率母関数・期待値・分散の導出

目次

前書き

 前エントリまでは離散型の確率分布に関して紹介してきました。今回からは連続型の確率分布について紹介していきます。
ガウス分布は「The 統計学」の分布です、なんでこんなに有名かというと中心極限定理のおかげでバンバン登場するからですね。 (中心極限定理や大数の法則に関しては別のエントリで詳しく書きますので今回はふーんそうなんだ程度で流してもらっても大丈夫です。) また、誤差を仮定するときにもよく使われるのでなんか知っているという方が多いのではないでしょうか? 平均パラメータ$\mu$と分散パラメータ$\sigma^2$を使って$N(\mu,\sigma^2)$と書かれます。 平均も分散も正直この表記で分かってしまいますが本ブログではちゃんと導出します。

 それではいつものように結論を見て導出の詳細を見ていきましょう。

初めに結論

項目
$x\in \mathbb{R} $
確率関数 $f(x;\mu,\sigma^2)=\frac{1}{\sqrt{2\pi \sigma^2}}\exp\left({-\frac{(x-\mu)^2}{2\sigma^2}}\right)$
積率母関数 $e^{(\mu t+\frac{\sigma^2t^2}{2})}$
平均 $\mu$
分散 $\sigma^2$

導出

積率母関数

$$ \begin{eqnarray} M_X(t)&=&\int_{-\infty}^{\infty}e^{tx}\frac{1}{\sqrt{2\pi \sigma^2}}\exp\left({-\frac{(x-\mu)^2}{2\sigma^2}}\right)dx\\\
&=&\frac{1}{\sqrt{2\pi \sigma^2}}\int_{-\infty}^{\infty}\exp{\left(-\frac{1}{2\sigma^2}(x^2-2(\mu+\sigma^2t)x+\mu^2)\right)}dx\\\
&=&\frac{1}{\sqrt{2\pi \sigma^2}}\int_{-\infty}^{\infty}\exp{\left(-\frac{1}{2\sigma^2}(x-(\mu+\sigma^2t))^2\right)}\exp{\left(\mu t+\frac{\sigma^2t^2}{2}\right)}dx\\\
&=&\exp{\left(\mu t+\frac{\sigma^2t^2}{2}\right)}\frac{1}{\sqrt{2\pi \sigma^2}}\int_{-\infty}^{\infty}\exp{\left(-\frac{1}{2\sigma^2}(x-(\mu+\sigma^2t))^2\right)}dx\\\
&=&\exp{\left(\mu t+\frac{\sigma^2t^2}{2}\right)} \end{eqnarray} $$

 導出過程を説明します。

  • 第二式から第三式:$x$に関係ない係数を積分の前に出し、指数関数の掛け算は指数部の足し算$e^ae^b=e^{a+b}$を利用し、二乗を展開してあげました。
  • 第三式から第四式:平方完成と$x$に関係する部分とそれ以外で先ほどとは逆に指数部分の足し算を全体の掛け算の形に分離しました。
  • 第四式から第五式:先ほど切り分けた$x$に関係ない項を積分の外に出してあげます。
  • 第五式から第六式:$\frac{1}{\sqrt{2\pi \sigma^2}}\int_{-\infty}^{\infty}\exp{\left(-\frac{1}{2\sigma^2}(x-(\mu+\sigma^2t))^2\right)}dx$が実は平均$\mu+\sigma^2t^2$で分散が$\sigma^2$のガウス分布$N(\mu+\sigma^2t^2,\sigma^2)$の台上の積分、すなわち確率の総和なので$1$となることを利用しました。

 やっていることは中学校でやる展開・平方完成、高校での指数関数の取り扱いだけですね。割と素直な式変形だけで導出できるので面白いですね。

平均

 $M_X(t)$を$t$で微分して$t=0$をやっていきます。

$$ \begin{eqnarray} E(X)&=&\frac{d}{dt}M_X(t)|_{t=0}=\left.\exp{\left(\mu t+\frac{\sigma^2t^2}{2}\right)}\right|_{t=0}\\\
&=&\left.(\mu+\sigma^2t)\exp{\left(\mu t+\frac{\sigma^2t^2}{2}\right)}\right|_{t=0}=\mu \end{eqnarray} $$

高校数学で学ぶ、指数関数の微分と合成関数の微分を落ち着いてやってあげるだけです。

分散

 分散は$E(X^2)-(E(X))^2$で求めることができますので、二次のモーメントを求めます。

$$ \begin{eqnarray} E(X^2)&=&\frac{d^2}{dt^2}M_X(t)|_{t=0}=\frac{d}{dt}\left.(\mu+\sigma^2t)\exp{\left(\mu t+\frac{\sigma^2t^2}{2}\right)}\right|_{t=0}\\\
&=&\sigma^2\exp{\left(\mu t+\frac{\sigma^2t^2}{2}\right)}+\left.(\mu+\sigma^2t)^2\exp{\left(\mu t+\frac{\sigma^2t^2}{2}\right)}\right|_{t=0}\\\
&=&\sigma^2+\mu^2 \end{eqnarray} $$

なので分散は、 $$ \begin{eqnarray} V(X)=\sigma^2+\mu^2-\mu^2=\sigma^2 \end{eqnarray} $$

まとめ

 The統計のガウス分布に関して紹介しました、確率密度関数は複雑に見えますが積率母関数の導出は計算は面倒ですが単純な式変形だけで求めることができました。 正直$N(\mu,\sigma^2)$とパラメータ自身が平均と分散なのでちゃんと求めてみたことない方は多いんじゃないでしょうか? 私は学生の頃はやってませんでしたw 社会人になって改めてやってみるとこんなに簡単だったのかと思いましたね。
 ガウス分布を知っているだけでなんか統計学やってるっぽいと思えてきます。 実際はそんなに甘いものでもないですが、実問題に適用するときでサンプル数が多いときなんかはガウス分布に落とし込めたり、最小二乗法で回帰するときに仮定する誤差がガウス分布に従っていたりと何かと登場の機会が多いのでこのタイミングでしっかり理解してあげましょう。

 それでは、統計検定1級を目指されている方や統計を勉強している方に良い情報提供となることを願って本日は失礼します。

参考文献

  • 日本統計学会編, “日本統計学会公式認定 統計検定1級対応 統計学”, 第6刷, 2013, 東京図書, ISBN 978-4-489-02150-3.
  • 藤澤洋徳, “確率と統計”, 第9刷, 2006, 朝倉書店, ISBN 978-4-254-11763-9.
  • 小寺平治, “明解演習 数理統計”, 初版30刷, 1986, 共立出版, ISBN 978-4-320-01381-0.