by nkoda

【統計検定1級対策】超幾何分布の積率母関数・期待値・分散の導出

目次

前書き

 あまり馴染みのない分布(少なくとも私は統計検定一級の勉強をするまでは知りませんでした)の超幾何分布を本エントリーでは紹介していきたいと思います。 あまり馴染みがないと思いますので言葉で分布をまずご紹介いたします。

 性質Aを持つ$M$とそれ以外$N-M$の合計$N$個があるとします。この$N$個から$n$個抽出した際に性質Aのものが含まれる個数を確率変数としたときに従う分布が超幾何分布です。そのことを理解していれば確率関数は自然に導かれますのでじっくり眺めて考えてみてください。
 $N$個から$n$個を取ってくるため分母はその組み合わせ数となり$\binom{N}{n}$、性質Aを持つ個数が$M$で$x$個取ってくるので$\binom{M}{x}$、残りの$n-x$個は性質Aを持たない$N-M$個から選んであげればいいので分子は$\binom{M}{x}\binom{N-M}{n-x}$となることが分かります。

 それではいつものように結論を確認してから、詳細を見ていきましょう。

初めに結論

項目
$\max(0,n-(N-M))\le x\le \min(n, M)$
確率関数 $P(X=x;N,M,n)=\frac{\binom{M}{x}\binom{N-M}{n-x}}{\binom{N}{n}}$
積率母関数 簡単な形で表現できない
平均 $n\frac{M}{N}$
分散 $n\frac{M}{N}\left(1-\frac{M}{N}\right)\frac{N-n}{N-1}$

導出

積率母関数

 超幾何分布は簡単な形で積率母関数を書き下せないので求めることはしません。 気になった方は一回定義通りにやってみてください、全然きれいな形に持っていけなくて嫌になると思いますw

平均

 超幾何分布は積率母関数が簡単な形式で表現できないため、定義に従って直接計算してあげることにします。 複雑に見えるかもですが、やっていることはパズルみたいなものです。 実際にやってみましょう。

$$ \begin{eqnarray} E(X)&=&\sum_{x=0}^{n}x\frac{\binom{M}{x}\binom{N-M}{n-x}}{\binom{N}{n}}\\\
&=&\sum_{x=1}^{n}x\frac{\binom{M}{x}\binom{N-M}{n-x}}{\binom{N}{n}}\\\
&=&n\frac{M}{N}\sum_{x=1}^{n}x\frac{\binom{M-1}{x}\binom{N-M}{n-x}}{\binom{N-1}{n-1}}\\\
&=&n\frac{M}{N}\sum_{x=1}^{n}\frac{\binom{M-1}{x-1}\binom{(N-1)-(M-1)}{(n-1)-(x-1)}}{\binom{N-1}{n-1}}\\\
&=&n\frac{M}{N} \end{eqnarray} $$

式変形の詳細を説明していきます、

  • 第二式から第三式:シグマの中身を$a_x:=x\frac{\binom{M}{x}\binom{N-M}{n-x}}{\binom{N}{n}}$の数列と見ると$x=0$の時は$a_0=0$なので足しても値が変わらないので添え字を$0$から$1$に変更しただけ
  • 第三式から第四式:$\binom{M}{x}=\frac{M!}{x!(M-x)!}=M\frac{(M-1)!}{x!(M-x)!}=M\binom{M-1}{x}$と、$\binom{N}{n}=\frac{N!}{n!(N-n)!}=\frac{N(N-1)!}{n(n-1)!(N-n)!}=\frac{N}{n}\binom{N-1}{n-1}$であることを利用
  • 第四式から第五式:上と同様に$\binom{M-1}{x}=\frac{1}{x}\binom{M-1}{x-1}$とすることと、意味ありげに$\binom{N-M}{n-x}=\binom{(N-1)-(M-1)}{(n-1)-(x-1)}$と変形してあげます(ただ単にすべての部分から$1$を引いただけなので結果は何も変わっていないことに注意してください)
  • シグマ全部消えました、なぜでしょう?ここで上でやった意味深な式変形の威力がさく裂です。実は$\frac{\binom{M-1}{x-1}\binom{(N-1)-(M-1)}{(n-1)-(x-1)}}{\binom{N-1}{n-1}}$はパラメータが$N-1,M-1,n-1$の超幾何分布の確率関数となっており、それを全部足し合わせるということは$1$となるので上手いこと見えなくなってくれました
     どうでした?なんかエゲつないことをしていそうで、単純なパズルを解いているだけですねw脳トレにはちょうどいい問題なんじゃないでしょうかw

分散

 まずは$E(X(X-1))$を求めます、なぜこんなものを求めるかといえば$E(X(X-1))=E(X^2-X)=E(X^2)-E(X)$となるので、$V(X)=E(X^2)-(E(X))^2$とするには$E(X(X-1))+E(X)-(E(X))^2$とできちゃうことと、離散の積率母関数を求めた際にやったように離散の場合はこのような$X(X-1)$が求めやすいことが多いと知っているからです。
早速計算していきましょう、こちらも先ほどの期待値でやったように組み合わせ計算のコンビネーションの性質を利用することと、超幾何分布の確率関数の形をつくってその総和が$1$となることを利用してあげます。 $$ \begin{eqnarray} E(X(X-1))&=&\sum_{x=0}^nx(x-1)\frac{\binom{M}{x}\binom{N-M}{n-x}}{\binom{N}{n}}\\\
&=&\sum_{x=2}^nx(x-1)\frac{\binom{M}{x}\binom{N-M}{n-x}}{\binom{N}{n}}\\\
&=&n(n-1)\frac{M(M-1)}{N(N-1)}\sum_{x=2}^n\frac{\binom{M-2}{x-2}\binom{(N-2)-(M-2)}{(n-2)-(x-2)}}{\binom{N-2}{n-2}}\\\
&=&n(n-1)\frac{M(M-1)}{N(N-1)} \end{eqnarray} $$ 式変形は先ほどと同様なので割愛しますが、一回は自分で手を動かして確認してみてくださいね、非常にいい脳トレになると思いますw手を動かしたほうが理解もできますし是非やってみることをお勧めします。

 では分散を求めましょう。 $$ \begin{eqnarray} V(X)&=&E(X(X-1))+E(X)-(E(X))^2\\\
&=&n(n-1)\frac{M(M-1)}{N(N-1)}+n\frac{M}{N}-n^2\frac{M^2}{N^2}\\\
&=&n\frac{M}{N^2}\frac{(N-n)(N-M)}{N-1}\\\
&=&n\frac{M}{N}\left(1-\frac{M}{N}\right)\frac{N-n}{N-1} \end{eqnarray} $$

まとめ

 いかがだったでしょうか?名前がごついのでちょっと身構えてしまいますが、確率関数の素直さ、期待値の計算や分散の導出過程の離散の二次モーメントの計算では組み合わせ計算のコンビネーションの性質の利用と、超幾何分布の確率関数を作りこむパズル、と意外と簡単なことしかしていないことに気が付きます。
とは言っても一回は自分でやっておかないとなかなか気付けなかったりするので是非ご自身の手を動かして練習してみてください。

 それではこのブログが統計を学んでいる方や統計検定1級取得を目指している方に少しでも情報提供になれること、このブログを通して数学・統計学を面白いと思っていただけることを願いまして本日もこのあたりで失礼します。

参考文献

  • 日本統計学会編, “日本統計学会公式認定 統計検定1級対応 統計学”, 第6刷, 2013, 東京図書, ISBN 978-4-489-02150-3.
  • 藤澤洋徳, “確率と統計”, 第9刷, 2006, 朝倉書店, ISBN 978-4-254-11763-9.
  • 小寺平治, “明解演習 数理統計”, 初版30刷, 1986, 共立出版, ISBN 978-4-320-01381-0.