統計検定1級では十分統計量について問われることが多いように感じる。十分統計量は分布のパラメータを十分に推定できる統計量のことで、フィッシャー・ネイマンの分解定理はそんな十分統計量を簡単に見分けることができる定理である。その分解定理を離散の場合での証明を本エントリで紹介する。
無作為抽出した標本からデータの背後に隠れる確率分布のパラメータを推し測るための枠組みである推定と点推定量が満たすと望ましい性質(不偏性・一致性・有効性)について紹介する。
F検定統計量が従うF分布は自由度がp,qの二つのカイ二乗分布から成り立っているため、変数変換で簡単に求めることができる。ここでもやはりガンマ関数の形を見出すことがポイントとなる。期待値や分散の導出では知らないとなかなか気が付けないような置換積分をすることで導出されることを本エントリで紹介する。
t検定統計量が従う分布であるt分布の確率密度関数の導出をまずは行う。期待値の計算では奇関数であることに気が付けば面倒な計算をする必要がない、また二次のモーメントの導出では変数変換することでガンマ関数の形に落とし込め、無事に分散を求めることができる。
いくつかの確率分布には面白い性質がある。今回はその中の再生性と無記憶性について紹介する。 再生性については積率母関数が存在範囲内で高々一つしか存在しないということを利用していく。つまり積率母関数が同等ならば確率分布は同じということを利用する。 無記憶性では条件付き確率を用いて証明する。
カイ二乗検定統計量が従う分布で、確率密度関数の導出はガンマ分布の再生性を利用する。つまり、カイ二乗分布はガンマ分布のあるパターンと同等である。積率母関数はガンマ関数の形に気が付くことができれば簡単に求められる。
危険率が一定ではない指数分布の亜種に当たるワイブル分布は、期待値・分散では置換積分を用いてガンマ関数の形を作ることで導出することができる。
他の確率分布の定義の仕方と異なり、多変量正規分布の定義は積率母関数の形が決まっている。多変量のため行列での表記となるが、期待値・分散の導出は一変量の確率分布と同じである。
対数正規分布に従う確率変数を対数変換すると正規分布になるという、名前がひっかけのようになっていることに注意。期待値・分散では置換積分を行うことで、ガウス分布の形が出てくる。そのためガウス分布の扱いに慣れていれば素直に導出ができる。
シグモイド関数の扱いに慣れた方は気が付きやすい変数変換でロジスティック分布の積率母関数を求める。ガンマ関数とベータ関数の関係性を利用することですっきりとした形に書くことができる。二次のモーメントの導出ではディガンマ関数の微分が級数展開でき、それがゼータ関数になっているという数学的に面白いストーリーとなっている。
統計検定一級で頻出されるため勉強をしていく上で欠かせない「変数変換によって作られる新しい確率変数の確率関数を求める」方法について先日紹介した、本エントリではその具体例を挙げて実際の計算過程について紹介していく。
統計検定一級で頻出されるため勉強をしていく上で欠かせない「変数変換によって作られる新しい確率変数の確率関数を求める」方法について紹介する。 それにあたって同時確率密度関数の周辺化と分布関数についても知っておかなければ話が見えにくくなるので、まずは分布関数とは何か、同時確率密度関数の周辺化とは何かから始めて最終的に変数変換によって確率密度関数を導出する方法を説明していく。
コーシー分布は積率母関数も期待値も分散も存在しない特殊な確率分布である。それらが存在しないことは期待値が存在しないことを示すことで導くことができる。期待値が存在しないことは広義積分が存在しないことから求める、この広義積分が収束しないことを本エントリで証明する。
ベータ分布の期待値、分散の導出を行う。ベータ分布のこれらの導出はベータ関数の形に気が付けるかがポイントとなる。ベータ分布はベイズ推論において二項分布の平均パラメータに対する共役事前分布となる嬉しい性質を持っている。
指数分布に従う確率変数の和が従う分布であるガウス分布。積率母関数はガンマ関数の形を見付けられるかがポイントとなる。平均や分散の導出は積率母関数の微分を利用してもいいが、定義通りに計算することでガンマ関数の形に落とし込む方法が楽だと思うのでその方法で導出を行う。
「積率母関数が存在する範囲」に注意することで、指数関数の積率母関数は導出することができる。期待値と分散は積率母関数を高校数学レベルの微分を駆使することで簡単に求めることができる。
統計学では避けて通れないガウス分布または正規分布。積率母関数の導出では平方完成と指数関数の性質を利用する。平均と分散に関しては結果を知ってはいると思うが、積率母関数を微分する方法で導出する。
二項分布の多クラス拡張である多項分布。積率母関数の導出では、無理やり二項定理の形を作るところがポイントとなる。期待値・分散の導出は注目のクラスで微分し全ての変数に0を代入してあげるだけである。その他周辺化と条件付き確率に関しても導出を行う。
統計検定一級で必要となる超幾何分布の一つ指数分布を丸裸にする。 検定試験ではイチから導出していると時間が無くなるので覚えてしまうことが推奨されているが、ただの暗記は忘れてし まったときに何もできなくなる、検定のためだけの意味のない学習となってしまう。 本ブログでは積率母関数の導出、期待値・分散の導入を解説し、着実な実力をつけ検定試験で忘れてしまっても導出でき るような力を養っていくことを目的としている。 導出できる力があれば、実務で統計モデルを組む際にも役立つと考えられる。
ポアソン分布が二項定理の平均を固定したうえ手試行回数を無限にしたときの分布であることをまずは証明する。積率母関数の導出では$e^x$のマクローリン展開を利用する。期待値・分散は積率母関数を微分し導出する。
幾何分布の一般化である負の二項分布は、積率母関数の導出では一般化二項定理を利用する。一般化二項定理の形さえ理解しておけば簡単に導出できることを紹介する。期待値・分散は積率母関数を微分し求める、結果を見れば確かに幾何分布の一般化となっていることが分かる。
無限回のベルヌーイ試行においてはじめて成功するまでに生じた失敗の回数が従う分布が幾何分布であり、無記憶性という性質を持つ。積率母関数の導出では高校数学レベルの無限級数和を求める方法を使用する。期待値・分散の導出は積率母関数を微分する方法で進めていく。
統計学の教科書でおなじみの二項分布について、積率母関数・期待値と分散の導出を紹介する。積率母関数の導出では項を上手くまとめると二項展開の形となることを利用する。期待値や分散では積率母関数を微分することで簡単に求めることができる。
一様分布の積率母関数は離散版では高校数学レベルの等比空列の和、連続では高校数学レベルの積分をすることで導出される。期待値・分散は定義通りに求めることが一番楽な導出となる。積率母関数を微分する方法でも導出ができるが計算が面倒であり、ロピュタルの定理を用いるなど手間の方が多くなるのであまりお勧めはしない。
統計検定一級では確率分布に関して自在に扱える能力が必須となる。 自在に扱うためには何ができればいいのか、分かっていればいいのかは積率母関数が導出できる、期待値・分散を導出できることであると考えている。なぜこの三点でいいのかについて本エントリーで紹介する。 検定試験ではイチから導出していると時間が無くなるので覚えてしまうことが推奨されているが、ただの暗記は忘れてしまったときに何もできなくなる、検定のためだけの意味のない学習となってしまう。 本ブログでは積率母関数の導出、期待値・分散の導入を解説し、着実な実力をつけ検定試験で忘れてしまっても導出できるような力を養っていくことを目的としている。 導出できる力があれば、実務で統計モデルを組む際にも役立つと考えられる。