【統計検定1級対策】t分布の期待値・分散の導出
目次
前書き
本日紹介するのは$t$分布です。
$t$検定で使用する$t$検定統計量が従う分布となっています。
$U\sim N(0,1), V\sim \chi^2(p)$が独立の時$X=\frac{U}{\sqrt{V/p}}$が従う分布は$t$分布となります。
先日学習しましたカイ二乗分布を用いて変数変換をします。
$U,V$のそれぞれの確率密度関数は
$$
\begin{eqnarray}
f_U(u)&=&\frac{1}{\sqrt{2\pi}}\exp{\left(-\frac{u^2}{2}\right)},\\\
f_V(v)&=&\frac{1}{\Gamma\left(\frac{p}{2}\right)}\left(\frac{1}{2}\right)^{\frac{p}{2}}v^{\frac{p}{2}-1}e^{-\frac12v}
\end{eqnarray}
$$
となります、ここで変数変換をしていくために$V=Y$を導入してあげます。
これで1対1の関数が定義できましたので逆関数を考えます。
$$
\begin{eqnarray}
u&=&x\sqrt{\frac{y}{p}}\\\
v&=&y
\end{eqnarray}
$$
$U,V$から$X,Y$へ変数変換しますのでヤコビアン$J(u,v)$を求めましょう。
$|J(u,v)|=\left|
\begin{vmatrix}
\sqrt{\frac{y}{p}} & \frac{x}{2\sqrt{py}} \\\
0 & 1
\end{vmatrix}
\right|
=\left|\sqrt{\frac{y}{p}}\right|
=\sqrt{\frac{y}{p}}$。
それでは変数変換の合言葉「分布関数を求めて、微分、周辺化」をやっていきます。
表記を楽にするため$A:=(-\infty,x]\times (-\infty,y]$、
$(X,Y)^T=\mathbf{h}(u,v)=(h_1(u,v),h_2(u,v))^T=\left(\frac{u}{\sqrt{v/p}},v\right)^T$、
$(U,V)^T=\mathbf{h}^{-1}(x,y)=(h_1^{-1}(x,y),h_2^{-1}(x,y))^T=\left(x\sqrt{\frac{y}{p}},y\right)^T$とすると、
$$
\begin{eqnarray}
F_{XY}(x,y)&=&P_{XY}((x,y)\in A)\\\
&=&P_{UV}((u,v)\in\mathbf{h}^{-1}(A))\\\
&=&\iint_{\mathbf{h}^{-1}(A)}f_U(u)f_V(v)dudv\\\
&=&\iint_{A}f_{U}\left(x\sqrt{\frac{y}{p}}\right)f_V(y)\sqrt{\frac{y}{p}}dxdy\\\
&=&\iint_{A}\frac{1}{\sqrt{2\pi}}\exp\left(-\frac{x^2y}{2p}\right)\frac{1}{\Gamma\left(\frac{p}{2}\right)}\left(\frac12\right)^{\frac{p}{2}}y^{\frac{p}{2}}e^{-\frac12y}\sqrt{\frac{y}{p}}dxdy
\end{eqnarray}
$$
同時分布を求めることができましたので$x,y$で偏微分することで同時確率密度関数を求められます。
$$
\begin{eqnarray}
f_{XY}(x,y)&=&\frac{\partial^2}{\partial x\partial y}F_{XY}(x,y)\\\
&=&\frac{1}{\sqrt{2\pi}}\exp\left(-\frac{x^2y}{2p}\right)\frac{1}{\Gamma\left(\frac{p}{2}\right)}\left(\frac12\right)^{\frac{p}{2}}y^{\frac{p}{2}-1}e^{-\frac12y}\sqrt{\frac{y}{p}}\\\
&=&\frac{1}{\sqrt{p}\Gamma\left(\frac{1}{2}\right)\Gamma\left(\frac{p}{2}\right)}\left(\frac{1}{2}\right)^{\frac{p+1}{2}}y^{\frac{p+1}{2}-1}e^{-\frac12\left(1+\frac{x^2}{p}\right)y}\\\
\end{eqnarray}
$$
$\frac{1}{\sqrt{2\pi}}=\left(\frac12\right)^{\frac12}\frac{1}{\Gamma\left(\frac12\right)}$はガンマ関数の特殊な値$\Gamma\left(\frac12\right)=\sqrt{\pi}$だったことを利用して式変形しました。
自然対数を$y$についてまとめた理由は、今回求めたいものは$X$の確率密度関数なので周辺化して消去するためです。
このようにまとめればガンマ関数がみえてきましたね。
$$
\begin{eqnarray}
f_X(x)&=&\int_{0}^{\infty}f_{XY}(x,y)dy\\\
&=&\frac{1}{\sqrt{p}\Gamma\left(\frac{1}{2}\right)\Gamma\left(\frac{p}{2}\right)}\left(\frac{1}{2}\right)^{\frac{p+1}{2}}\frac{\Gamma\left(\frac{p+1}{2}\right)}{\left(\frac{1}{2}\left(1+\frac{x^2}{p}\right)\right)^{\frac{p+1}{2}}}\\\
&=&\frac{1}{\sqrt{p}}\frac{\Gamma((p+1)/2)}{\Gamma(1/2)\Gamma(p/2)}\left(1+\frac{x^2}{p}\right)^{-\frac{p+1}{2}}\\\
&=&\frac{1}{\sqrt{p}B(p/2,1/2)}\left(1+\frac{x^2}{p}\right)^{-\frac{p+1}{2}}
\end{eqnarray}
$$
ここでの式変形はガンマ関数と、ガンマ関数とベータ関数の関係性$B(a,b)=\frac{\Gamma(a)\Gamma(b)}{\Gamma(a+b)}$を利用しました。
ここまででだいぶ数学して疲れたかと思いますが、いつものように結論を見て導出の詳細を見ていきましょう。
初めに結論
項目 | 値 |
---|---|
台 | $x\in \mathbb{R}$ |
確率関数 | $f(x)=\frac{1}{\sqrt{p}B(p/2,1/2)}\left(1+\frac{x^2}{p}\right)^{-\frac{p+1}{2}}$ |
積率母関数 | きれいな形で求まらない |
平均 | $0\quad;p>1$ |
分散 | $\frac{p}{p-2}\quad; p>2$ |
導出
積率母関数
$t$分布はきれいな形で積率母関数が求まりませんので導出はしません。
平均
定義通りに計算してあげます。
計算するにあたって$g(x):=xf(x)=Ax\left(1+\frac{x^2}{p}\right)^{-\frac{p+1}{2}}$を先に考えます、ただし$A=\frac{1}{\sqrt{p}B(p/2,1/2)}$としています。
$g(-x)=-Ax\left(1+\frac{x^2}{p}\right)^{-\frac{p+1}{2}}=-g(x)$となっているので実は$t$分布の期待値計算における被積分関数は奇関数となっています。
積分範囲が$(-\infty,\infty)$と対称なので期待値は$0$となります。
奇関数であるということに気が付けば面倒な計算をする必要がありませんので省エネですね。
分散
分散は$E(X^2)-(E(X))^2$で求めることができますので、二次のモーメントを定義通り求めます。 先にネタばらししておくと、二次モーメントでは被積分関数が偶関数となることを利用します。 積分区間が$(0,\infty)$となりますが形がガンマ関数の形ではありません、上手く置換することで実はベータ関数の形を作ることができます。 置換する前までの式変形をしていきましょう。 表記を楽にするため定数の部分は$A=\frac{1}{\sqrt{p}B(p/2,1/2)}$としておきます。
$$
\begin{eqnarray}
E(X^2)&=&A\int_{-\infty}^{\infty}x^2\left(1+\frac{x^2}{p}\right)^{-\frac{p+1}{2}}dx\\\
&=&2A\int_0^{\infty}x^2\left(1+\frac{x^2}{p}\right)^{-\frac{p+1}{2}}dx
\end{eqnarray}
$$
積分区間的にはガンマ関数の形になってほしいですが、残念ながらガンマ関数の形ではありません。
$x$と$1+x$の形が見えるのですがベータ関数は$x^{a-1}(1-x)^{b-1}$の形で積分区間が$(0,1)$なのでうまくあてはまりません。
でしたら、無理やりベータ関数の形へもっていってしまえばいいのです。
今回は$\frac{1}{t}=1+\frac{x^2}{p}$としてあげます。
これは一回経験していないとなかなか気が付けない置換ですね。
先の置換により、$x^2=p\left(\frac{1}{t}-1\right)\Rightarrow x=p^{1/2}\left(\frac{1}{t}-1\right)^{1/2}$となりますので、
$\frac{dx}{dt}=-\frac12p^{\frac12}t^{-2}\left(\frac{1}{t}-1\right)^{-\frac12}$で、$t$の積分範囲は$1\to 0$となります。
$$
\begin{eqnarray}
E(X^2)&=&2A\int_0^{\infty}x^2\left(1+\frac{x^2}{p}\right)^{-\frac{p+1}{2}}dx\\\
&=&2A\int_1^0p\left(\frac{1}{t}-1\right)t^{\frac{p+1}{2}}\left(-\frac{p^{\frac12}}{2}\right)t^{-\frac32}(1-t)^{-\frac12}dt\\\
&=&p\sqrt{p}A\int_0^1t^{\left(\frac{p}{2}-1\right)-1}(1-t)^{\frac12}dt\\\
&=&\frac{p\sqrt{p}}{\sqrt{p}B(p/2,1/2)}B\left(\frac{p}{2}-1,\frac32\right)\\\
&=&p\frac{\Gamma((p+1)/2)}{\Gamma(p/2)\Gamma(1/2)}\frac{\Gamma\left(\frac{p}{2}-1\right)\Gamma\left(\frac32\right)}{\Gamma((p+1)/2)}\\\
&=&p\frac{\Gamma\left(\frac{p}{2}-1\right)\frac12\Gamma\left(\frac12\right)}{\left(\frac{p}{2}-1\right)\Gamma\left(\frac{p}{2}-1\right)\Gamma\left(\frac12\right)}\\\
&=&\frac{p}{p-2}
\end{eqnarray}
$$
式変形を説明します。
- 第二式から第三式:先ほど説明した置換積分を実施しました。
- 第三式から第四式:$-1$があるのでそれを利用し積分範囲を入れ替え、定数項を積分の外に出し式を整理しました。ベータ関数が分かるようにあえて変なまとめ方をしています。
- 第四式から第五式:$A=\frac{1}{\sqrt{p}B(p/2,1/2)}$だったのでそれを戻し、ベータ関数を$B(\cdot,\cdot)$の形に書き換えました。
- 第五式から第六式:ベータ関数をガンマ関数の形に書き換えました。$B(a,b)=\frac{\Gamma(a)\Gamma(b)}{\Gamma(a+b)}$ですね。
- 第六式から第七式:$\Gamma((p+1)/2)$は約分し消しました、またガンマ関数の性質の$\Gamma(a)=(a-1)\Gamma(a-1)$を利用して式変形しました。
なかなか重い計算でしたが約分されシンプルな結果となりましたね。
以上より分散は、 $$ \begin{eqnarray} V(X)=\frac{p}{p-2}\mbox{。} \end{eqnarray} $$
まとめ
確率密度関数の導出が少しヘビーでしたね。 また二次のモーメントの導出の中で経験してないとなかなか気が付けないような置換がありました。 統計検定一級のために確率密度関数を覚えてもいいですがなかなか覚えるのには複雑すぎると思うので、 冒頭に書いた$U\sim N(0,1), V\sim\chi^2(p)$が独立で$X=\frac{U}{\sqrt{V/p}}$が従う分布ということだけ覚えて、 何度も手を動かしサラな状態から何も見ずに導出できるようにしておくのがいいのではないかなと思ってます。 私はこの確率密度関数などは覚える気にはなりませんので検定で出てしまったらイチから導出するつもりです。
それでは、統計検定1級を目指されている方や統計を勉強している方に良い情報提供となることを願って本日は失礼します。
参考文献
- 日本統計学会編, “日本統計学会公式認定 統計検定1級対応 統計学”, 第6刷, 2013, 東京図書, ISBN 978-4-489-02150-3.
- 藤澤洋徳, “確率と統計”, 第9刷, 2006, 朝倉書店, ISBN 978-4-254-11763-9.
- 小寺平治, “明解演習 数理統計”, 初版30刷, 1986, 共立出版, ISBN 978-4-320-01381-0.