【統計検定1級対策】指数分布の積率母関数・期待値・分散の導出
目次
前書き
二日ほど更新をさぼってしまいました。。。 昨日は嫁がずっと行きたがっていた飯能市にあるムーミン谷に行ってきました。久しぶりにそれなりに歩いたので少し疲れましたが、暑すぎずちょうどいい感じに楽しめました。 ニョロニョロのバームクーヘンがすごい長くて面白かったので買うか迷いましたが、お昼ご飯食べた後お腹いっぱいだったので買う気がなくなり結局買いませんでした。 嫁はアングリームーミンという怒った顔のムーミンを買えて喜んでいました。
と、ここ数日更新していなかった言い訳をしましたところで本題に入りましょう。 本日は指数分布に関して紹介いたします。これは後日紹介しますガンマ分布の特殊形の分布です。 生存時間が従う分布で、具体的に説明しますと、寿命が使い始めてからの経過時間に依存しない一定値$\lambda$の製品の寿命を確率変数$X$とすると$X\sim e(\lambda)$のようになります。
それではいつものように結論を見て導出の詳細を見ていきましょう。
初めに結論
項目 | 値 |
---|---|
台 | $x\in \mathbb{R}_{>0} $ |
確率関数 | $f(x;\lambda)=\lambda e^{-\lambda x}$ |
積率母関数 | $\frac{\lambda}{\lambda-t}$ |
平均 | $\frac{1}{\lambda}$ |
分散 | $\frac{1}{\lambda^2}$ |
導出
積率母関数
$$
\begin{eqnarray}
M_X(t)&=&\int_{-\infty}^{\infty}e^{xt}\lambda e^{-\lambda x}dx\\\
&=&\lambda\int_{0}^{\infty}\exp{((t-\lambda)x)}dx\\\
&=&\lambda\left(\lim_{R\to\infty}\left[\frac{1}{t-\lambda}\exp{((t-\lambda)x)}\right]_0^R\right)\\\
&=&\lambda\left(\lim_{R\to\infty}\left(\frac{\exp{((t-\lambda)R)}}{t-\lambda}-\frac{1}{t-\lambda}\right)\right)\\\
&=&\frac{\lambda}{\lambda-t}
\end{eqnarray}
$$
導出過程を説明します。
- 第二式から第三式:定数を前に出し、指数をまとめ上げました。ついでに積分範囲も台以外は確率は$0$なので台上で全範囲へと変更。
- 第三式から第四式:広義積分となるため一旦$(0,R)$の範囲での指数関数の積分を行いその$R$を無限大まで飛ばします。
- 第四式から第五式:上の不定積分で求めた関数に$R$と$0$を代入してあげました。
- 第五式から第六式:ここで「いや場合分けしろよ!」とツッコミを入れた方はよく数学を勉強されていらっしゃいますね。確かに本来ならば第五式の第一項は$(t-\lambda)$の振る舞いで極限が変わるはずです。しかし、積率母関数の便利な条件によれば、積率母関数が存在する適当な$0$近傍だけを$t$の範囲として選ぶことができます、つまり第一項が収束する$t-\lambda<0$となる範囲だけを考えればいいので残るのは第五式の第二項のみです。これに前に残っていた定数$\lambda$をかけて、全体にかかっている$-1$を分母に負担してもらえば第六式が導出されます。
広義積分は大学数学の範囲ですが、結局極限取る前に適当な変数$R$を導入し指数関数の定積分を実施してあげて、その変数を極限取ってあげただけですね。それと積率母関数の便利な条件「積率母関数が存在する適当な$0$近傍を$t$の範囲としてあげる」を利用して導出することができました。
平均
$M_X(t)$を$t$で微分して$t=0$をやっていきます。
$$
\begin{eqnarray}
E(X)&=&\frac{d}{dt}M_X(t)|_{t=0}=\left.\left(\frac{d}{dt}\frac{\lambda}{\lambda-t}\right)\right|_{t=0}\\\
&=&\left.\frac{-\lambda(-1)}{(\lambda-t)^2}\right|_{t=0}=\frac{1}{\lambda}
\end{eqnarray}
$$
高校数学で学ぶ、指数関数の微分と商の微分・合成関数の微分を落ち着いてやってあげるだけです。
分散
分散は$E(X^2)-(E(X))^2$で求めることができますので、二次のモーメントを求めます。
$$
\begin{eqnarray}
E(X^2)&=&\frac{d^2}{dt^2}M_X(t)|_{t=0}=\left.\frac{d}{dt}\frac{\lambda}{(\lambda-t)^2}\right|_{t=0}\\\
&=&\left.\frac{-\lambda(-2)(\lambda-t)}{(\lambda-t)^4}\right|_{t=0}=\frac{2}{\lambda}
\end{eqnarray}
$$
指数関数・合成関数の微分と商の微分を丁寧にやってあげるだけですね。
なので分散は、 $$ \begin{eqnarray} V(X)=\frac{2}{\lambda}+\left(\frac{1}{\lambda}\right)^2=\frac{1}{\lambda} \end{eqnarray} $$
まとめ
冒頭の説明で申し上げた通り、寿命を確率変数としたときに経過時間によらず一定の値で死亡すると仮定すると確率変数は指数分布に従います。
実は、確率密度関数を$f(x)$そして累積分布関数$F(x)$を持つ分布において、
$$
r(x)=\frac{f(x)}{1-F(x)}
$$
を危険率(hazard rate)と呼ばれます。
時刻$x$まで生存し$x+\Delta x$に死亡する確率が$r(x)\Delta x$で与えられるためこのように呼ばれています。
実際に微分方程式$$\frac{d}{dx}\log{(1-F(x))}=\lambda$$
を初期条件$F(0)=0$としてとくと指数分布$e(\lambda)$の累積密度分布が得られることが分かります。
また、冒頭のタイミングで申し上げた通り、ベータ分布の特殊形のぶんぷとなっています、このことはベータ分布を紹介する際に改めて説明する予定です。
読者の中には「経過時間によらず一定の寿命」じゃなくて「時間とともに危険率が変化する」時はどうなるの?と思われた方がいらっしゃるかもしれません。
その質問に関して回答は「後日紹介しますワイブル分布という別の確率分布」となります。
また、実は指数分布は幾何分布と同様に無記憶性という性質を持ちます、このことはまとめて別エントリで紹介していく予定です。1
それでは、統計検定1級を目指されている方や統計を勉強している方に良い情報提供となることを願って本日は失礼します。
参考文献
- 日本統計学会編, “日本統計学会公式認定 統計検定1級対応 統計学”, 第6刷, 2013, 東京図書, ISBN 978-4-489-02150-3.
- 藤澤洋徳, “確率と統計”, 第9刷, 2006, 朝倉書店, ISBN 978-4-254-11763-9.
- 小寺平治, “明解演習 数理統計”, 初版30刷, 1986, 共立出版, ISBN 978-4-320-01381-0.