by nkoda

【統計検定1級対策】ガンマ分布の積率母関数・期待値・分散の導出

目次

前書き

 今日は暑かったですが、何となくチゲ鍋が食べたくなり嫁も同じことを思っていたようでしたのでキムチチゲ鍋を作りました。 もう食べ終わるころには汗だくでしたね、暑いのに暑いもの食べたくなるこの感情は僕だけなのでしょうか? 昆布で出汁を取るところからやったのでおもしろかったですよ、味も良かったと思ってます。

 本題に入りましょう、本日はガンマ分布に関して紹介いたします。 先日紹介した指数分布の一般化した分布です。 ガンマ分布は指数分布に従う確率変数の和が従う分布となっています。 また、名前から推測される通り先日紹介しましたガンマ関数をつかって表現されますので、ガンマ関数ってどんな性質持っていたっけ?という方はこちらで復習しておきましょう。

 それではいつものように結論を見て導出の詳細を見ていきましょう。

初めに結論

項目
$x\in \mathbb{R}_{>0} $
確率関数 $f(x;p,q)=\frac{q^p}{\Gamma(p)}x^{p-1}e^{-qx}$
積率母関数 $\left(\frac{q}{q-t}\right)^p$
平均 $\frac{p}{q}$
分散 $\frac{p}{q^2}$

導出

積率母関数

$$ \begin{eqnarray} M_X(t)&=&\int_{-\infty}^{\infty}e^{xt}\frac{q^p}{\Gamma(p)}x^{p-1}e^{-qx}dx\\\
&=&\frac{q^p}{\Gamma(p)}\int_{0}^{\infty}x^{p-1}e^{-(q-t)x}dx\\\
&=&\frac{q^p}{\Gamma(p)}\frac{\Gamma(p)}{(q-t)^p}\\\
&=&\left(\frac{q}{q-t}\right)^p \end{eqnarray} $$

 導出過程を説明します。

  • 第二式から第三式:定数を前に出し、指数をまとめ上げました。ついでに積分範囲も台以外は確率は$0$なので台上で全範囲へと変更。
  • 第三式から第四式:第三式のまとめ方を見て「っあ!」と思えたら統計検定の基本分布の導出は怖くないというくらいの実力がついてきていると思います。 ガンマ関数の確率密度関数を再び見直してみてください、$\frac{q^p}{\Gamma(p)}$の定数部分が実は後ろのガンマ関数の積分結果を正規化(確率の総和を$1$にする、つまり$\int_{0}^{\infty}x^{p-1}e^{-qx}dx=\frac{\Gamma(p)}{q^p}$ということ)するために存在しています。 なので第三式の積分部分の形を見つけたら確率密度関数の定数部分の逆数を書いてあげればいいのです。

 実は確率密度関数の係数部分が正規化するためなんだということさえ知ってしまえば簡単でしたね、このように式の意味を考えてあげることで単純な暗記ではなしえないフレキシブルな式変形ができるのです。

平均

 $M_X(t)$を$t$で微分して$t=0$をやってあげてもいいのですが、ガンマ分布は定義通りに計算しガンマ分布の確率密度関数の総和を求める積分の形を作ってあげることで簡単に導出できます。

$$ \begin{eqnarray} E(X)&=&\int_{0}^{\infty}x\frac{q^p}{\Gamma(p)}x^{p-1}e^{-qx}dx\\\
&=&\frac{q^p}{\Gamma(p)}\int_{0}^{\infty}x^{(p+1)-1}e^{-qx}dx\\\
&=&\frac{q^p}{\Gamma(p)}\frac{\Gamma(p+1)}{q^{(p+1)}}\\\
&=&\frac{p}{q} \end{eqnarray} $$

先日のガンマ関数とベータ関数のエントリをしっかり学習した方は、$\Gamma(p+1)=p\Gamma(p)$だったことに気づけたかと思います、きれいに約分できてしまうんですね。

分散

 分散は$E(X^2)-(E(X))^2$で求めることができますので、二次のモーメントを定義通りに求めます。

$$ \begin{eqnarray} E(X^2)&=&\int_{0}^{\infty}x^2\frac{q^p}{\Gamma(p)}x^{p-1}e^{-qx}dx\\\
&=&\frac{q^p}{\Gamma(p)}\int_{0}^{\infty}x^{(p+2)-1}e^{-qx}dx\\\
&=&\frac{q^p}{\Gamma(p)}\frac{\Gamma(p+2)}{q^{(p+2)}}\\\
&=&\frac{p(p+1)}{q^2} \end{eqnarray} $$

なので分散は、 $$ \begin{eqnarray} V(X)=\frac{p(p+1)}{q^2}-\left(\frac{p}{q}\right)^2=\frac{p}{q^2} \end{eqnarray} $$

まとめ

 確率密度関数の定数部分が正規化のためにあるということを知ってしまえばすごい簡単に積率母関数も期待値・分散を求めてしまうことができましたね。 よく式や公式の意味を考えずに必死に覚えようとしている方を拝見しますが、それはかなりしんどい作業だと思います、 もちろん全ての式や公式に理解しやすいストーリーがあるとは限りません、ですがストーリーで理解できてしまえば覚える量を減らせるし忘れにくくなると思いますので、 可能な限り数式を見たらストーリーをイメージしてあげてください、そうすると空気を吸うように当たり前の式変形の流れが掴めて他の時にも役立ってきます。
 また、冒頭に申し上げた通りガンマ分布は「指数分布に従う独立な確率変数の和」が従う分布となっています、 ガンマ分布を$Ga(p,q)$、指数分布を$e(\lambda)$と表記するとすれば、$Ga(1,\lambda)=e(\lambda)$となっています。 逆に考えれば、$X_1,\ldots,X_p\overset{i.i.d}{\sim}e(\lambda)$の和なので$Y=X_1+\ldots+X_p\sim Ga(p,\lambda)$の関係が成り立つのです。

 それでは、統計検定1級を目指されている方や統計を勉強している方に良い情報提供となることを願って本日は失礼します。

参考文献

  • 日本統計学会編, “日本統計学会公式認定 統計検定1級対応 統計学”, 第6刷, 2013, 東京図書, ISBN 978-4-489-02150-3.
  • 藤澤洋徳, “確率と統計”, 第9刷, 2006, 朝倉書店, ISBN 978-4-254-11763-9.
  • 小寺平治, “明解演習 数理統計”, 初版30刷, 1986, 共立出版, ISBN 978-4-320-01381-0.