【統計検定1級対策】幾何分布の積率母関数・期待値・分散の導出
目次
前書き
幾何分布は無限に続くベルヌーイ試行で初めて成功する(本によっては失敗すると定義しているものもある)までの失敗の回数を確率変数としたときに従う分布です。
ベルヌーイ試行は二項分布の$n=1$の特殊形でしたね、つまり$B(1,p)$でした。
二項分布ってなんだっけという方は先日のエントリーを見返してみてください。
確率分布は幾何分布の意味を知っていれば簡単にかけてしまいます、そんな「幾何分布」について紹介します。
初めに結論
項目 | 値 |
---|---|
台 | $x\in \mathbb{N}\cup set(0)$1 |
確率関数 | $P(X=x;p)=p(1-p)^x$ |
積率母関数 | $\frac{p}{1-e^t(1-p)}$ |
平均 | $\frac{1-p}{p}$ |
分散 | $\frac{1-p}{p^2}$ |
導出
積率母関数
ポイントは高校数学でやる無限級数和を求めることです。つまり第$n$部分和を求め、それを$n\rightarrow\infty$としてあげることです。
それでは早速導出してみましょう。
$$
\begin{eqnarray}
M_X(t)&=&\sum_{x=0}^{\infty}e^{tx}(1-p)^{x}p=p\sum_{x=0}^{\infty}(e^t(1-p))^x\\\
&=&p\lim_{n\rightarrow\infty}\sum_{x=0}^{n}(e^t(1-p))^x=p\lim_{n\rightarrow\infty}\frac{1*(1-(e^t(1-p))^{n+1})}{1-e^t(1-p)}
\end{eqnarray}
$$
この極限は発散するかもしれませんし、有限確定値にもなり得る状態だから場合分けかな?と思った方はよく数学を理解してらっしゃいます。しかし今回はその読みを裏切ります。
積率母関数の定義を思い出してみると、$t$の範囲は積率母関数が存在するような$0$近傍でよかったのです。
なので今回は有限確定値に収束してくれるような、$0\le e^t(1-p) < 1$であるような範囲の$t$なので、
$$ \begin{eqnarray} M_X(t)&=&p\lim_{n\rightarrow\infty}\frac{(1-(e^t(1-p))^{n+1})}{1-e^t(1-p)}=\frac{p}{1-e^t(1-p)} \end{eqnarray} $$
と積率母関数を求めることができました。
統計検定一級では全て証明できる必要があるので、非常にシンプルですが久しぶりにやってみるとなんだっけ?となるので、この説明を読んで理解したらご自身の手で一回、二回とすべて自力で導出できるようになるまで練習してみてください。
平均
先に求めた$M_X(t)$を$t$で微分して$t=0$とすればいいことは、先日のエントリで証明しました。 実際にやってみましょう。
$$
\begin{eqnarray}
E(X)&=&\frac{d}{dt}M_X(t)|_{t=0}=\left.\frac{-p(-(1-p)e^t)}{(1-e^t(1-p))^2}\right|_{t=0}\\\
&=&\frac{p*(1-p)*1}{(1-1*(1-p))^2}=\frac{1-p}{p}
\end{eqnarray}
$$
高校数学で学ぶ、指数関数の微分と商の微分を落ち着いてやってあげるだけです。
分散
分散は$E(X^2)-(E(X))^2$で求めることができますので、二次のモーメントを求めましょう。 ちょっとしきがながくなりますが、積の微分・商の微分・合成関数の微分を丁寧にやっていくだけです。2
$$
\begin{eqnarray}
E(X^2)&=&\frac{d^2}{dt^2}M_X(t)|_{t=0}=\frac{d}{dt}\frac{d}{dt}M_X(t)|_{t=0}
=\left.\frac{d}{dt}\frac{p(1-p)e^t}{(1-e^t(1-p))^2}\right|_{t=0}\\\
&=&\left.\frac{p(1-p)e^t(1-e^t(1-p))^2-p(1-p)e^t(-2(1-p)e^t(1-e^t(1-p)))}{(1-e^t(1-p))^4}\right|_{t=0}\\\
&=&\left.\frac{p(1-p)e^t(1-e^t(1-p))+2p(1-p)^2e^{2t}}{(1-e^t(1-p))^3}\right|_{t=0}\\\
&=&\frac{p(1-p)*1*(1-1*(1-p))+2p(1-p)^2*1}{(1-1*(1-p))^3}=\frac{p^2-3p+2}{p^2}
\end{eqnarray}
$$
なので分散は、 $$ \begin{eqnarray} V(X)=\frac{p^2-3p+2}{p^2}-\left(\frac{1-p}{p}\right)^2=\frac{1-p}{p^2} \end{eqnarray} $$
まとめ
幾何分布の要点をまとめましたが、まだ説明しきっていない部分もあります。
幾何分布は無記憶性という$X>x_1$という条件のもと$X\ge x_1+x_2$の確率が$x_1$の結果に影響されない性質を持っています。\
これは条件付き確率を丁寧に計算すれば分かりますが、この辺りは二項分布が再生性を持つと紹介した時と同様に別のエントリでまとめてご紹介できればと思います。
無記憶性に関してエントリを書きました、詳細はコチラをご参照ください。
また、実は幾何分布は今後紹介する予定の負の二項分布の特殊形なのです、それはまた負の二項分布を紹介するときにコメントしておきます。(負の二項分布は一般化二項定理を利用するなど数学的に面白いので楽しみにしていてください。)
確率分布の紹介が終わったあたりで各分布間の関連性(特殊化・一般化、極限操作)を紹介していこうと思います。
その前に紹介する確率分布は$20$個3ほどありますので、タフですが最後までついてきてください!
それではこのブログが統計を学んでいる方や統計検定1級取得を目指している方に少しでも情報提供になれること、このブログを通して数学・統計学を面白いと思っていただけることを願いまして本日はこのあたりで失礼します。
参考文献
- 日本統計学会編, “日本統計学会公式認定 統計検定1級対応 統計学”, 第6刷, 2013, 東京図書, ISBN 978-4-489-02150-3.
- 藤澤洋徳, “確率と統計”, 第9刷, 2006, 朝倉書店, ISBN 978-4-254-11763-9.
- 小寺平治, “明解演習 数理統計”, 初版30刷, 1986, 共立出版, ISBN 978-4-320-01381-0.