by nkoda

【統計検定1級対策】確率変数の変数変換の具体例

目次

前書き

 先日は確率変数の変数変換に関して紹介しました。 そこでは理論的な紹介をしましたがいまいち具体例がないと分かり辛いとおもいますので本エントリでは一変数と二変数の具体例を挙げて計算方法を紹介したいと思います。 変数変換は統計検定一級でも頻出ですし、なにより新しい分布の確率密度関数が計算できるので統計モデルの際に非常に役立ちます。 本エントリを通してしっかり理解してしまいましょう。

 確率変数の変数変換による新しい確率密度関数の導出の合言葉だけ始めに示しておきましょう。
分布関数を求めて微分。(多変数の場合はその後周辺化)

変数変換の具体例

一変数の変数変換

 連続な確率変数$X$の確率密度関数を$f(x)$とします。 ここで1対1の関数$g(X)=X^2$によって変数変換された確率密度関数$Y=X^2$を考えます。 1対1の関数なので逆関数$x=g^{-1}(y)=\sqrt{y}$が存在します。 $-\sqrt{x}$もありますが確率は非負ですので逆関数として正の方だけ考えることにしましょう。 $Y$の分布関数$F_Y(y)$を求めそれを微分することで$Y$の確率密度関数$f_Y(y)$を求めていきます。

$$ \begin{eqnarray} F_Y(y)&=&P(Y\le y)\\\
&=&P(X^2\le y)\\\
&=&P(X\le g^{-1}(y))\\\
&=&P(-\sqrt{y}\le X\le\sqrt{y})\\\
&=&\int_{-\sqrt{y}}^{\sqrt{y}}f_X(x)dx\\\
f_Y(y)&=&\frac{d}{dy}F_Y(y)\\\
&=&\frac{1}{2\sqrt{y}}f_X(\sqrt{y})-\left(-\frac{1}{2\sqrt{y}}f_X(-\sqrt{y})\right)\\\
&=&\frac{1}{2\sqrt{y}}\left(f_X(-\sqrt{y})+f_X(-\sqrt{y})\right) \end{eqnarray} $$

一変数の場合はとてもシンプルに導出できましたね。 合言葉通り分布関数を求めて微分してあげただけです。

 今回は一般化した確率密度関数$f_X(x)$でやりましたが、これが具体的にガウス分布であればそいつを突っ込んであげればいいだけです。 特に$X\sim N(0,1)$で$Y=X^2$の時は$Y$は自由度$1$の$\chi^2$分布、つまり$Y\sim\chi(1)$に従うことがこの導出から明らかになります。 $\chi^2$分布は検定統計量としてよく出てくるものです、この辺りに関しては後日紹介しますのでそれまでお待ちください。

二変数の変数変換

 確率変数$X,Y$は独立であるとし、その同時確率密度関数を$f_{XY}(x,y)$とします。 独立なので$f_{XY}(x,y)=f_X(x)f_Y(y)$と表記することができます。 一般には独立であるとは限りませんが、統計検定一級ではよく独立を扱いますので今回は独立で紹介していますが、独立でない場合は同時密度関数を積の形にしないだけで同様に計算できますのでご安心ください。 今回は$U=X+Y$の確率変数の和を考えてあげることにしましょう。 ここで連続な1対1の多変量関数を$\mathbf{g}(x,y)=(g_1(x,y),g_2(x,y))=(x+y,x)$を考えてあげましょう。 つまり、$u=g_1(x,y)=x+y,v=g_2(x,y)=x$なので逆関数は$x=g_1^{-1}(u,v)=v,y=g_2^{-1}(u,v)=u-v$となります。1
 読者の方は何か違和感を感じたかもしれません、$U=X+Y$の確率密度関数を求めるのに何で$V=X$という謎の確率変数を導入したのだろうかと。 正直私もそのあたりの理論的なことはしっかりとは理解していませんが、この方が都合よく計算していけるのです。 おそらく1対1の連続な関数にするためとか、二変数から二変数への変換の方がヤコビアンが計算しやすいとかあるんじゃないですかね?この辺りはよくわかっていないので詳しい読者の方がいらっしゃいましたらお問い合わせフォームからご教示いただけると幸いです。
話を本題に戻しましょう。 逆関数を求める部分まで完了しました。 導出の中で重積分内で$(X,Y)\mapsto(U,V)$に変数変換しますのでヤコビアンを求めておきます。

$$ \begin{eqnarray} |J(u,v)|&=& \left|\left| \begin{array}{rr} \frac{\partial x}{\partial u} & \frac{\partial x}{\partial v} \\\
\frac{\partial y}{\partial u} & \frac{\partial y}{\partial v} \end{array} \right|\right|\\\
&=& \left|\left| \begin{array}{rr} 1 & 0 \\\
1 & -1 \end{array} \right|\right|\\\
&=&1 \end{eqnarray} $$ ヤコビアンまで求めればあとは合言葉通りにやっていきます、表記が面倒なので$A:=(-\infty,u]\times(-\infty,v]$としておきます。

$$ \begin{eqnarray} F_{UV}(u,v)&=&P((U,V)\in A)\\\
&=&P((X,Y)\in \mathbf{g}^{-1}(A))\\\
&=&\iint_{\mathbf{g}^{-1}(A)}f_{XY}(x,y)dxdy\\\
&=&\iint_{\mathbf{g}^{-1}(A)}f_X(x)f_Y(y)dxdy\\\
&=&\iint_{A}f_X(g_1^{-1}(u,v))f_Y(g_2^{-1}(u,v))|J(u,v)|dudv\\\
&=&\iint_{A}f_X(v)f_Y(u-v)dudv\\\
f_{UV}(u,v)&=&\frac{\partial}{\partial u\partial v}F_{UV}(u,v)=f_X(v)f_Y(u-v)\\\
f_U(u)&=&\int_{-\infty}^{\infty}f_X(v)f_Y(u-v)dv \end{eqnarray} $$

合言葉通りに分布関数を求め、全ての変数で偏微分し、目的の$U$について周辺化してあげました。 ただの重積分の変数変換ですが慣れないとなんだったっけ?となるので繰り返し演習をやってみてください。

 演習にちょうど良いので変数変換の四則演算の結果についてまとめておきます。すべて同様に求められるのでやってみてください。 ポイントは$V$を1対1になりつつ、後で楽にヤコビアンを計算したり、積分消去しやすいように選んであげる部分です。2

U 一般の場合3 独立の場合3
$X+Y$ $f_U(u)=\int_{-\infty}^{\infty}f_{XY}(x,u-x)dx$ $f_U(u)=\int_{-\infty}^{\infty}f_{X}(x)f_Y(u-x)dx$
$X-Y$ $f_U(u)=\int_{-\infty}^{\infty}f_{XY}(x,x-u)dx$ $f_U(u)=\int_{-\infty}^{\infty}f_X(x)f_Y(x-u)dx$
$XY$ $f_U(u)=\int_{-\infty}^{\infty}f_{XY}(x,\frac{u}{x})\frac{1}{|x|}dx$ $\int_{-\infty}^{\infty}f_X(x)f_Y(\frac{u}{x})\frac{1}{|x|}dx$
$X/Y$ $f_U(u)=\int_{-\infty}^{\infty}f_{XY}(uy,y)|y|dy$ $f_U(u)=\int_{-\infty}^{\infty}f_X(uy)f_Y(y)|y|dy$

まとめ

 前回のエントリが抽象的で分かり辛かった方は今回のエントリでだいぶ計算方法などが見えてきたのではないでしょうか? 今後紹介する確率分布では変数変換によって確率密度関数を求めるものが多くなりますのでこのタイミングでしっかり理解してあげてください。
 統計検定一級ではこの確率変数の変数変換は頻出ですのでしっかりできるようにしておけば大問一つはいただいたようなものですのでそのためにも何度も体になじむまで練習してください。 練習問題が欲しい方は本ブログで散々参考文献としてあげています小寺平治さんの「明解演習 数理統計」を購入してみてはいかがでしょうか? 統計検定一級に必要な知識はこの本で一通り演習することができると私は思います。 私自身、以前に統計に関して色々相談させていただいておりました方からこの本補紹介していただきました。 とても演習書としてはいい問題がそろっているように感じましたので是非見てみてください。

 それでは、統計検定1級を目指されている方や統計を勉強している方に良い情報提供となることを願って本日は失礼します。

参考文献

  • 日本統計学会編, “日本統計学会公式認定 統計検定1級対応 統計学”, 第6刷, 2013, 東京図書, ISBN 978-4-489-02150-3.
  • 小寺平治, “明解演習 数理統計”, 初版30刷, 1986, 共立出版, ISBN 978-4-320-01381-0.
  • 藤澤洋徳, “確率と統計”, 第9刷, 2006, 朝倉書店, ISBN 978-4-254-11763-9.

  1. 1対1となればいいので$V=Y$にしても問題はありません。 ↩︎

  2. 積の商の場合は分母に来る変数を$V$に選んであげるとヤコビアンの計算などいろいろと計算が楽です。 ↩︎

  3. 上の例では積分消去は$v$で実施していますがこの一覧では$x$で積分消去しています。この積分消去は定積分なので$v=x$としても問題ないわけです。 ↩︎