by nkoda

【統計検定1級対策】二項分布の積率母関数・期待値・分散の導出

目次

前書き

 統計の参考書を開けば必ず紹介される二項分布の積率母関数・期待値・分散の導出を紹介いたします。 サイコロを3回投げ$5,6$の目が出る回数を確率変数としたとき(この例では$X\in set(0,1,2,3)$1となります。)に従うのが二項分布です。 二項分布は試行回数のパラメータ$n$と該当する確率を表すパラメータ$p$を用いて$B(n,p)$と表記されることが一般的です。 この例では$n=3, p=\frac{1}{3}$ですね、他にもコインを10回投げて表が出る回数を確率変数とすれば$B(10,\frac12)$となります。
複数回試行を行いある事象の出現回数が従う分布である「二項分布」について紹介します。

初めに結論

項目
$x\in set(0,1,2,\ldots,n) $1
確率関数 $P(X=x;n,p)=\binom{n}{x}p^x(1-p)^{n-x}$
積率母関数 $(e^tp+1-p)^n$
平均 $np$
分散 $np(1-p)$

導出

積率母関数

 ポイントは二項展開の形にうまく落とし込むことです。 初めに二項展開について勉強しましょう。二項展開の特殊形は中学生の時に皆さん触れています。 $(a+b)^2=a^2+2ab+b^2$が二項展開の$n=2$の特殊形です、見覚えありますよね? これを一般化してみると、 $(a+b)^n=\sum_{x=0}^n\binom{n}{x}a^xb^{n-x}$となります。 シグマの後の$\binom{n}{x}$について少し説明しておきます、 $(a+b)^n=(a+b)(a+b)\cdots(a+b)$と$(a+b)$が$n$個並びます。 中学校で学ぶ展開は、かっこいい名前付いていますが、一個目の$(a+b)$から$a$か$b$のどちらかを選び、二個目の$(a+b)$から同様にどちらか選び・・・をしているにすぎません。 また、各項の係数は何個同じものがあるかを表しているので、$a^xb^{n-x}$を作るには$n$個の中から$a$を$x$個選ぶ組み合わせの数を求めればいいだけなので$\binom{n}{x}$となっている訳です。 意外と中学の時ってこのようにちゃんと意味を考えないもんですよね、数学は覚えるものではなく意味を考え、当たり前の操作を行っていくものだと、塾講師をしていた時に生徒にどや顔で言っていましたw
 本筋に話を戻します。 二項展開に注意しながら積率母関数を求めていきましょう。

$$ \begin{eqnarray} M_X(t)&=&\sum_{x=0}^{n}e^{tx}\binom{n}{x}p^x(1-p)^{n-x}\\\
&=&\sum_{x=0}^{n}\binom{n}{x}(e^tp)^x(1-p)^{n-x}\\\
&=&(e^tp+1-p)^n \end{eqnarray} $$

式変形を説明しますと、

  • 第二式から第三式:$x$乗を持つ項をまとめました
  • 第三式から第四式:$a=e^tp,b=1-p$にした二項展開の形が見えるので二項展開の形にしてあげました。

非常にシンプルですが慣れないとなかなか見抜けないので、この説明を読んで理解したらご自身の手で一回、二回とすべて自力で導出できるようになるまで練習してみてください。

平均

 先に求めた積率母関数$M_X(t)$を$t$で微分して$t=0$とすればいいことは、先日のエントリで証明しました。 実際にやってみましょう。

$$ \begin{eqnarray} E(X)&=&\frac{d}{dt}M_X(t)|_{t=0}\\\
&=&npe^t(e^tp+1-p)^{n-1}|_{t=0}\\\
&=&np \end{eqnarray} $$

高校数学で学ぶ、指数関数の微分と合成関数の微分を落ち着いてやってあげるだけです。
微分が終われば後は$t=0$を代入してあげるだけですね。

分散

 分散は$E(X^2)-(E(X))^2$で求めることができますので、二次のモーメントを求めましょう。

$$ \begin{eqnarray} E(X^2)&=&\frac{d^2}{dt^2}M_X(t)|_{t=0}\\\
&=&\frac{d}{dt}\frac{d}{dt}M_X(t)|_{t=0}\\\
&=&\frac{d}{dt}npe^t(e^tp+1-p)^{n-1}|_{t=0}\\\
&=&npe^t(e^tp+1-p)^{n-1}+n(n-1)p^2e^{2t}(e^tp+1-p)^{n-2}|_{t=0}\\\
&=&np(p+1-p)+n(n-1)p^2(p+1-p)\\\
&=&np+n(n-1)p^2 \end{eqnarray} $$

なので分散は、 $$ \begin{eqnarray} V(X)=(np+n(n-1)p^2)-(np)^2=np-np^2=np(1-p) \end{eqnarray} $$

まとめ

 実は統計の本では二項分布の前にベルヌーイ試行について話しているものが多いです。 ベルヌーイ試行はサイコロ一回投げて1の目が出るや、コインを一回投げて表が出るなどを確率変数ととらえたものです。 勘のいい読者さんはお気付きかと思いますが、これは二項分布の$n=1$の特殊形であるというだけです。 そのため本ブログではいきなり二項分布から説明をしました。
 二項分布の要点をまとめましたが、まだ説明しきっていない部分もたくさんあります。 二項分布は再生性という性質を持っていたりします。 これは積率母関数と確率分布は1対1に対応するというありがたい定理から導出します、この辺りはまた別のエントリでまとめてご紹介できればと思います。
(追記)再生性に関してのエントリを書きました、詳細が気になる方はこちらをご覧ください。
 今後紹介するポアソン分布や正規分布などに極限操作することで二項分布は近似することが可能です。 大学の期末試験や統計検定1級ではその導出などを問うてくることもありますので基礎となる二項分布はしっかり押さえておきましょう。

参考文献

  • 日本統計学会編, “日本統計学会公式認定 統計検定1級対応 統計学”, 第6刷, 2013, ISBN 978-4-489-02150-3.
  • 藤澤洋徳, “確率と統計”, 第9刷, 2006, ISBN 978-4-254-11763-9.
  • 小寺平治, “明解演習 数理統計”, 初版30刷, 1986, ISBN 978-4-320-01381-0.

  1. MathJax+hugoでこのblogを書いています、なぜか \{\} が認識されず波括弧が打てなかったのでset()で集合を表すことにしました。 ↩︎