by nkoda

【統計検定1級対策】カイ二乗分布の積率母関数・期待値・分散の導出

目次

前書き

 本エントリから検定統計量が従う分布を紹介していきます。 本日は$\chi^2$分布です、カイ二乗検定で使用するカイ二乗統計量が従う分布となります。 どんな分布かといいますと、$Y_1,\ldots,Y_p\overset{i.i.d}{\sim}N(0,1)$の時、$X=\sum_{i=1}^{p}Y_i^2$が従う分布となります。 つまりここまで私が紹介してきたガウス分布と変数変換によってできる確率変数の導出がマスターされていれば簡単に確率密度関数が導出されるわけです。 とはいえ今回は直接変数変換で導出のではなく、$Y_1\sim N(0,1)$で$X=Y_1^2$がガンマ分布に従うことを示し、ガンマ分布の再生性を利用していきます。

そういえば再生性や無記憶性についてエントリ書くといっていてまだ書いていないことを思い出しました。。。必ず書きますのでお許しくださいmm1

 それでは確率分布を導出しておきましょう。 $Y_1\sim N(0,1)$なので$f_{Y}(y)=\frac{1}{\sqrt{2\pi}}\exp\left(-\frac{y^2}{2}\right)$であり、$X=Y_1^2$は一変数の変数変換でしたね、合言葉は「分布関数求めて微分」でした。 $$ \begin{eqnarray} F(x)&=&P_X(X\le x)\\\
&=&P_Y(Y_1^2\le x)\\\
&=&P_Y(-\sqrt{x}\le Y_1\le \sqrt{x})\\\
&=&\int_{-\sqrt{x}}^{\sqrt{x}}\frac{1}{\sqrt{2\pi}}\exp\left(-\frac{y^2}{2}\right)dy\\\
f(x)&=&\frac{d}{dx}F(x)\\\
&=&\frac{1}{\sqrt{2\pi}}\frac{1}{\sqrt{x}}\exp\left(-\frac{x}{2}\right)-\frac{1}{\sqrt{2\pi}}\left(-\frac{1}{\sqrt{x}}\right)\exp\left(-\frac{x}{2}\right)\\\
&=&\frac{1}{\sqrt{\pi}\sqrt{2}}x^{-\frac12}\exp\left(-\frac{x}{2}\right)\\\
&=&\frac{1}{\Gamma\left(\frac12\right)}\left(\frac12\right)^{\frac12}x^{-\frac12}\exp\left(-\frac{x}{2}\right)\\\
&\sim&Ga\left(\frac12,\frac12\right) \end{eqnarray} $$ 導出に関しては$\Gamma(\frac{1}{2})=\sqrt{\pi}$であることだけ注意すれば、それ以外は高校数学レベルの微分で理解することができます。
 自由度$1$のカイ二乗分布は$Ga(\frac12,\frac12)$に従うことが分かりました、ガンマ分布$Ga(a,b)$は$a$について再生性があります。 つまりガンマ分布を足し合わせてもガンマ分布になってくれるので、自由度$p$のカイ二乗分布は$Ga\left(\frac{p}{2},\frac12\right)$となるわけです。

 それではいつものように結論を見て導出の詳細を見ていきましょう。

初めに結論

項目
$x\in \mathbb{R}_{>0} $
確率関数 $f(x)=\frac{1}{\Gamma\left(\frac{p}{2}\right)}\left(\frac12\right)^{\frac{p}{2}}x^{\frac{p}{2}-1}\exp\left(-\frac{x}{2}\right)$
積率母関数 $(1-2t)^{-\frac{p}{2}}$
平均 $p$
分散 $2p$

導出

積率母関数

$$ \begin{eqnarray} M_X(t)&=&\frac{1}{\Gamma\left(\frac{p}{2}\right)}\left(\frac12\right)^{\frac{p}{2}}\int_0^{\infty}e^{tx}x^{\frac{p}{2}-1}\exp\left(-\frac{x}{2}\right)dx\\\
&=&\frac{1}{\Gamma\left(\frac{p}{2}\right)}\left(\frac12\right)^{\frac{p}{2}}\int_0^{\infty}x^{\frac{p}{2}-1}\exp\left(-\left(\frac{1}{2}-t\right)x\right)dx\\\
&=&\frac{1}{\Gamma\left(\frac{p}{2}\right)}\left(\frac12\right)^{\frac{p}{2}}\frac{\Gamma\left(\frac{p}{2}\right)}{\left(\frac12-t\right)^{\frac{p}{2}}}\\\
&=&(1-2t)^{-\frac{p}{2}} \end{eqnarray} $$

 説明する部分はほとんどないですが、念のため補足しておきます。 第二式は定義通りにかいてあげただけです、第三式は自然対数の部分をまとめました。 この形といえばガンマ関数ですねということで第四式で$\Gamma$を使って書き直し、約分して第五式となるわけです。

平均

 $M_X(t)$を$t$で微分して$t=0$をやっていきます。

$$ \begin{eqnarray} E(X)&=&\left.\frac{d}{dt}M_X(t)\right|_{t=0} \\\
&=&\left.-\frac{p}{2}(-2)(1-2t)^{-\frac{p}{2}-1}\right|_{t=0}\\\
&=&p \end{eqnarray} $$

高校数学の微分をしているだけなので、特に説明は不要ですね。

分散

 分散は$E(X^2)-(E(X))^2$で求めることができますので、二次のモーメントを求めます。

$$ \begin{eqnarray} E(X^2)&=&\left.\frac{d^2}{dt^2}M_X(t)\right|_{t=0}\\\
&=&\frac{d}{dt}\left.p(1-2t)^{-\frac{p}{2}-1}\right|_{t=0}\\\
&=&\left.p\left(-2\left(-\frac{p}{2}-1\right)\right)(1-2t)^{-\frac{p}{2}-2}\right|_{t=0}\\\
&=&p^2+2p \end{eqnarray} $$

なので分散は、 $$ \begin{eqnarray} V(X)=p^2+2p-p^2=2p \end{eqnarray} $$

まとめ

 導出の中で変数変換による確率変数の確率密度関数の導出をし、ガンマ関数の形を見付けてあげました。 エントリはまだ書けていませんがガンマ関数の再生性1を利用するなどちょっとしたテクニックをふんだんに使っており、個人的には導出が面白かったです。 統計検定一級における確率分布の扱いとしては、変数変換とガンマ関数・ベータ関数にいかに気が付けるかがポイントだと私は思っております。 何度も手を動かしこの三点のエッセンスは正確に理解しておいてあげましょう。 今後紹介します検定統計量の確率分布では二つの確率変数の変数変換を行いますので、それを見ながら変数変換を理解していきましょう。 先にこちらや具体例を載せたこちらで復習しておいていただくとよりスムーズに理解できると思いますのでお時間のある方はご確認ください。

 それでは、統計検定1級を目指されている方や統計を勉強している方に良い情報提供となることを願って本日は失礼します。

参考文献

  • 日本統計学会編, “日本統計学会公式認定 統計検定1級対応 統計学”, 第6刷, 2013, 東京図書, ISBN 978-4-489-02150-3.
  • 藤澤洋徳, “確率と統計”, 第9刷, 2006, 朝倉書店, ISBN 978-4-254-11763-9.
  • 小寺平治, “明解演習 数理統計”, 初版30刷, 1986, 共立出版, ISBN 978-4-320-01381-0.

  1. 【追記】再生性と無記憶性に関してエントリを書きました、詳細はコチラをご覧ください。 ↩︎