ポアソン分布

ポアソン分布
	確率質量関数; ; 横軸は確率変数値 k 。確率質量関数は k が 0 以上の整数でだけ定義される。
	累積分布関数; ; 横軸は確率変数値 k 。確率質量関数は k が 0 以上の整数でだけ定義されるので、整数値以外では分布関数は平らになる。
母数
台
確率質量関数
累積分布関数	について、; ; または、; ここで、は不完全ガンマ関数で、; は床関数である。
期待値
中央値
最頻値
分散
歪度
尖度
エントロピー	; （大きいについて）;
モーメント母関数
特性関数
	テンプレートを表示

統計学および確率論で用いられるポアソン分布（英: Poisson distribution）とは、ある事象が一定の時間内に発生する回数を表す離散確率分布である。

数学者シメオン・ドニ・ポアソンが1838年に確率論とともに発表した。

ある離散的な事象について、ポアソン分布は所与の時間内での生起回数の確率を示し、指数分布は生起間隔の確率を示す^[1]。

定義

定数 $λ > 0$ に対し、 $0$ 以上の整数を値にとる確率変数 $X$ が

P(X=k)={\frac {\lambda ^{k}e^{-\lambda }}{k!}}

を満たすとき、確率変数 $X$ は母数 $λ$ のポアソン分布に従うという。

ここで、 $e$ はネイピア数 ( $e = 2.71828\dots$ )であり、 $k!$ は $k$ の階乗を表す。また、 $λ$ は所与の区間内で発生する事象の期待発生回数に等しい。

$P (X = k)$ は、「所与の時間中に平均で $λ$ 回発生する事象がちょうど $k$ 回（ $k$ は非負の整数）発生する確率」に相当する。例えば、事象が平均で10分間に5回発生する場合、10分間の中で事象が発生する回数は、 $λ = 5$ のポアソン分布モデルを使って求められる。

性質

平均・分散

ポアソン分布の平均 $E[X]$ および分散 $V[X]$ は、 $λ$ に等しい^[2]。

{\begin{aligned}\operatorname {E} [X]&=\lambda ,\\\operatorname {V} [X]&=\lambda .\end{aligned}}

最頻値

ポアソン分布の最頻値は、 $λ$ 以下で最大の整数である。

積率母関数

平均 $λ$ のポアソン分布の積率母関数 $M X (t)$ は、

M_{X}(t)=\operatorname {E} \left[e^{tX}\right]=\sum _{k=0}^{\infty }e^{tk}P(X=k)=\sum _{k=0}^{\infty }e^{tk}{\frac {\lambda ^{k}e^{-\lambda }}{k!}}=e^{\lambda (e^{t}-1)}

で与えられる。

モーメント

ポアソン分布の高次モーメントは、 $λ$ を含むトゥシャール多項式であり、二項係数を持つ。

{\begin{aligned}m_{1}&=\operatorname {E} [X]=\lambda ,\\m_{2}&=\operatorname {E} [X^{2}]=\lambda ^{2}+\lambda ,\\m_{3}&=\operatorname {E} [X^{3}]=\lambda ^{3}+3\lambda ^{2}+\lambda ,\\&\vdots \end{aligned}}

ポアソン分布の $n$ 次の階乗モーメント（英語版）は $λ n$ である。

\operatorname {E} [X(X-1)\dotsm (X-n+1)]=\lambda ^{n}.

キュムラント

ポアソン分布の $n$ 次のキュムラント $κ n$ は全て、平均 $λ$ と等しい。

\kappa _{n}=\left.{\frac {\partial ^{n}}{\partial t^{n}}}\log {\bigl (}M_{X}(t){\bigr )}\right\vert _{t=0}=\lambda .

再生性

ポアソン分布は再生性をもつ。すなわち、 $X$ と $Y$ とが独立な確率変数であり、それぞれパラメータ $λ$ , $μ$ のポアソン分布に従うとき、確率変数の和 $X + Y$ はパラメータ $λ + μ$ のポアソン分布に従う。

その他

ポアソン分布は無限分解可能な確率分布である。

近似

$λ$ が十分に大きい（たとえば $λ > 1000$ ）ならば、平均 $λ$ 、標準偏差 $\sqrt λ$ の正規分布はこのポアソン分布の非常によい近似となる。おおよそ $λ > 10$ であれば、適切な連続な分布への修正がなされている場合に限り、正規分布はこのポアソン分布のよい近似となる。例えば $P (X \leq x)$ に関して、 $x$ が非負の整数ならば、 $P (X \leq x + 0.5)$ と置換することができる。

ポアソン過程

$λ$ は、単位時間あたりの事象の平均発生回数などの割合と見なされる場合があり、到着率と呼ばれる。このとき、 $N t$ を時刻 $t$ より前に発生した事象の回数とすると、

P(N_{t}=k)={\frac {e^{-\lambda t}(\lambda t)^{k}}{k!}}

となる。この式を満たす確率過程をポアソン過程という。さらに、最初の事象が発生するまでの待機時間 $T$ は、指数分布による連続確率変数である。この確率分布は、次のように導くことができる。

P(T>t)=P(N_{t}=0).

時間を含む場合、すなわち1次元ポアソン過程では、各時間内で事象が発生する回数を確率変数とする離散ポアソン分布と、待機時間を確率変数とする連続アーラン分布の両方を含んでいる。1よりも高い次元のポアソン過程についても同様である。

事象

具体的な例

ポアソン分布は、ポアソン過程（英語版）に関連して発生する。これは、離散的な自然現象（所与の領域内や所与の時間内において、0回、1回、2回、3回… と発生する現象）に該当するものであり、現象が発生する確率は、時間ないし空間内において一定である。また、時間または空間における発生間隔は指数分布になる。次に、その例を示す。

1時間に特定の交差点を通過する車両の台数。
1ミリリットルの希釈された水試料中に含まれる特定の細菌の数^[3]（細菌数検査における最確法）。
単位面積あたりの雨粒の数。
1ページの文章を入力するとき、綴りを間違える回数。
1日に受け取る電子メールの件数。
1時間あたりの電話がかかってくる件数。
ある一定の時間内の店への来客数。
1分間のWebサーバへのアクセス数。
- 例えば、1時間あたりのウィキペディアの最近更新したページの編集数もおおよそポアソン分布。
1キロメートルあたりのある通り沿いのレストランの軒数。
1ヘクタールあたりのエゾマツの本数。
1立方光年あたりの恒星の数。
単位時間あたりの放射線の計数値であるカウント毎分やカウント毎秒（半減期による減衰や外部からの放射能などによる変動がないと仮定して）。

歴史的例

上記の例のほか、歴史的に有名な事例としては、ロシア生まれでドイツで活躍した経済学者、統計学者のボルトケヴィッチ（ドイツ語版） (Владислав Иосифович Борткевич) による「プロイセン陸軍で馬に蹴られて死亡した兵士数」の例が知られている。ボルトケヴィッチは著書 „Das Gesetz der kleinen Zahlen “ (The Law of Small Numbers)^[4]において、プロイセン陸軍の14の騎兵連隊の中で、1875年から1894年にかけての20年間で馬に蹴られて死亡する兵士の数について調査しており、1年間当たりに換算した当該事案の発生件数の分布が母数 $0.61$ のポアソン分布によく従うことを示している。

事象の特徴

上記のように、稀にしか起こらないような現象を大量に観測した結果がポアソン分布に従う例は極めて多く見られる。このようなポアソン分布に従う事象の中で、時間の経過とともに発生する事象の特徴は次のようにまとめられる。

（希少性）：時間幅 $∆ t$ の間に着目している事象がちょうど1回起こる確率が $λ ∆ t + o (∆ t)$ 、2回以上起こる確率が $o (∆ t)$
（定常性）：事象の起きる確率は、どの時間帯で同じ
（独立性）：事象の起きる確率は、それ以前に起こった事象の回数や起こり方には無関係

ここで、 $o (∆ t)$ は $∆ t$ に対して高位の無限小を表しており、 $∆ t$ のスケールに注目したときに無視できる微小量であることを表す。

極限定理

パラメータが $n$ と $p = λ / n$ である二項分布において、 $λ$ を一定に保ったまま $n$ を無限大に近づけると、その分布は平均 $λ$ のポアソン分布に近づく。すなわち、

\lim _{\lambda =np,~n\to \infty }{\binom {n}{k}}p^{k}(1-p)^{n-k}={\frac {\lambda ^{k}e^{-\lambda }}{k!}}

が成り立つ。これをポアソンの極限定理という。この定理の名は、数学者シメオン・ドニ・ポアソンが1837年に著書 « Recherches sur la probabilite des jugements » (Researches on the Probabilities)^[5]の中で結果を与えたことに由来する。なお、この中で、二項分布の極限としてポアソン分布が初めて導出されている。

導出の詳細を次に示す。計算には、以下の関係式を用いる。

\lim _{n\to \infty }\left(1-{\frac {\lambda }{n}}\right)^{n}=e^{-\lambda }.

ここで $p = λ / n$ とすると、

{\begin{aligned}\lim _{n\to \infty }P(X=k)&=\lim _{n\to \infty }{\binom {n}{k}}p^{k}(1-p)^{n-k}\\&=\lim _{n\to \infty }{\frac {n!}{(n-k)!\,k!}}\left({\frac {\lambda }{n}}\right)^{k}\left(1-{\frac {\lambda }{n}}\right)^{n-k}\\&=\lim _{n\to \infty }\underbrace {\left({\frac {n}{n}}\right)\left({\frac {n-1}{n}}\right)\left({\frac {n-2}{n}}\right)\dotsm \left({\frac {n-k+1}{n}}\right)} \underbrace {\left({\frac {\lambda ^{k}}{k!}}\right)} \underbrace {\left(1-{\frac {\lambda }{n}}\right)^{n}} \underbrace {\left(1-{\frac {\lambda }{n}}\right)^{-k}} .\end{aligned}}

$n$ を無限大に近づけると、4つの下波括弧のうち、最初の下波括弧の部分は $1$ に近づく。2番目の下波括弧の部分には $n$ が出現しないので、そのままである。3番目の下波括弧の部分は $e - λ$ に近づく。最後の下波括弧の部分は $1$ に近づく。

したがって極限は存在し、

{\frac {\lambda ^{k}e^{-\lambda }}{k!}}

となる。

少数の法則

法則という言葉は、確率分布の同義語として使われることがあり、法則収束は分布の収束を意味する。したがってポアソン分布は、滅多に起こり得ない希少な事象の発生数の確率分布であることから、少数の法則と呼ばれることがある。

脚注

[脚注の使い方]

^ @teramonagi (2012年1月28日). “指数分布とポアソン分布のいけない関係”. SlideShare. 2012年1月27日閲覧。
^ 土居正明. 二項分布と Poisson 分布の平均・分散 (PDF) (Report). ポアソン分布の平均と分散の導出
^ “Do bacterial cell numbers follow a theoretical Poisson distribution? Comparison of experimentally obtained numbers of single cells with random number generation via computer simulation” (英語). Food Microbiology 60: 49–53. (2016-12-01). doi:10.1016/j.fm.2016.05.019. ISSN 0740-0020.
^ Ladislaus von Bortkiewicz (1898) (PDF), Das Gesetz der kleinen Zahlen, University of Wasington Library, Leipzig Druck und Verlag von B.G.Teubner 復刻版が2010年にNabu Pressより発売されている
^ Par Simeon Denis Poisson (1857) (PDF), Recherches sur la probabilité des Jugements, Des Regles Generares du Calcul des Probabilites, Bacheliar, Impremeur-Libraire.

外部リンク

『ポアソン分布の意味と平均・分散』 - 高校数学の美しい物語

[ポアソン分布-1] @teramonagi (2012年1月28日). “指数分布とポアソン分布のいけない関係”. SlideShare. 2012年1月27日閲覧。

[mean_diviatuin-2] 土居正明. 二項分布と Poisson 分布の平均・分散 (PDF) (Report). ポアソン分布の平均と分散の導出

[3] “Do bacterial cell numbers follow a theoretical Poisson distribution? Comparison of experimentally obtained numbers of single cells with random number generation via computer simulation” (英語). Food Microbiology 60: 49–53. (2016-12-01). doi:10.1016/j.fm.2016.05.019. ISSN 0740-0020.

[Ladislaus-4] Ladislaus von Bortkiewicz (1898) (PDF), Das Gesetz der kleinen Zahlen, University of Wasington Library, Leipzig Druck und Verlag von B.G.Teubner 復刻版が2010年にNabu Pressより発売されている

[Poisson-5] Par Simeon Denis Poisson (1857) (PDF), Recherches sur la probabilité des Jugements, Des Regles Generares du Calcul des Probabilites, Bacheliar, Impremeur-Libraire.

[1]

[2]

[3]

[4]

[5]

確率質量関数横軸は確率変数値 $k$ 。確率質量関数は $k$ が $0$ 以上の整数でだけ定義される。
累積分布関数横軸は確率変数値 $k$ 。確率質量関数は $k$ が $0$ 以上の整数でだけ定義されるので、整数値以外では分布関数は平らになる。
母数	$\lambda >0$
台	$\{0,1,2,3,\dotsc \}$
確率質量関数	${\frac {\lambda ^{k}}{k!}}\cdot e^{-\lambda }$
累積分布関数	$k\geq 0$ について、 ${\frac {\Gamma (\lfloor k+1\rfloor ,\lambda )}{\lfloor k\rfloor !}}$ または、 $e^{-\lambda }\sum _{i=0}^{k}{\frac {\lambda ^{i}}{i!}}$ ここで、 $\Gamma (x,y)$ は不完全ガンマ関数で、 $\lfloor k\rfloor$ は床関数である。
期待値	$\lambda$
中央値	$\approx \left\lfloor \lambda +{\frac {1}{3}}-{\frac {0.02}{\lambda }}\right\rfloor$
最頻値	$\lfloor \lambda \rfloor$
分散	$\lambda$
歪度	$\lambda ^{-1/2}$
尖度	$\lambda ^{-1}$
エントロピー	${\begin{aligned}&\lambda {\bigl [}1-\log(\lambda ){\bigr ]}\\&{}+e^{-\lambda }\sum _{k=0}^{\infty }{\frac {\lambda ^{k}\log(k!)}{k!}}\end{aligned}}$ （大きい $\lambda$ について） ${\begin{aligned}&{\frac {1}{2}}\log(2\pi e\lambda )-{\frac {1}{12\lambda }}\\&{}-{\frac {1}{24\lambda ^{2}}}-{\frac {19}{360\lambda ^{3}}}+O\left({\frac {1}{\lambda ^{4}}}\right)\end{aligned}}$
モーメント母関数	$\exp {\bigl (}\lambda (e^{t}-1){\bigr )}$
特性関数	$\exp {\bigl (}\lambda (e^{it}-1){\bigr )}$
テンプレートを表示

表話編歴確率分布
離散単変量で有限台	ベンフォードベルヌーイベータ二項（英語版）二項 categorical（英語版）超幾何ポワソン二項ラーデマッハ（英語版）離散一様ジップジップ–マンデルブロー（英語版）
離散単変量で無限台	ベータ負二項（英語版）ボレル（英語版）コンウェイ–マクスウェル–ポワソン（英語版）離散位相型（英語版）ドラポルト（英語版）拡張負二項（英語版）ガウス–クズミン幾何対数（英語版）負の二項放物フラクタル（英語版）ポワソンスケラム（英語版）ユール–サイモン（英語版）ゼータ（英語版）
連続単変量で有界区間に台を持つ	逆正弦（英語版） ARGUS（英語版）バルディング–ニコルス（英語版）ベイツ（英語版）ベータ beta rectangular（英語版）アーウィン–ホール（英語版）クマラスワミー（英語版）ロジット-正規（英語版）非中心ベータ（英語版） raised cosine（英語版） reciprocal（英語版）三角 U-quadratic（英語版）一様ウィグナー半円
連続単変量で半無限区間に台を持つ	ベニーニ（英語版）ベンクタンダー第一種（英語版）ベンクタンダー第二種（英語版）第2種ベータ Burr（英語版）カイ二乗カイ（英語版） Dagum（英語版）デービス（英語版）指数-対数（英語版）アーラン指数 F folded normal（英語版） Flory–Schulz（英語版）フレシェガンマ gamma/Gompertz（英語版）一般逆ガウス（英語版） Gompertz（英語版） half-logistic（英語版） half-normal（英語版） Hotelling's T-squared（英語版）超アーラン（英語版）超指数（英語版） hypoexponential（英語版）逆カイ二乗（英語版） scaled inverse chi-squared（英語版）逆ガウス逆ガンマコルモゴロフレヴィ対数コーシー対数ラプラス（英語版）対数ロジスティック（英語版）対数正規ロマックス（英語版）行列指数（英語版）マクスウェル–ボルツマンマクスウェル–ユットナー（英語版）ミッタク-レフラー（英語版）仲上（英語版）非心カイ二乗パレート位相型（英語版） poly-Weibull（英語版）レイリー relativistic Breit–Wigner（英語版）ライス（英語版） shifted Gompertz（英語版）切断正規タイプ2ガンベル（英語版）ワイブル離散ワイブル（英語版）ウィルクスのラムダ（英語版）
連続単変量で実数直線全体に台を持つ	コーシー（ローレンツ、ブライト・ウィグナー）指数冪（英語版）フィッシャーの z（英語版）ガウスの q（英語版）一般正規（英語版）一般化双曲型幾何安定（英語版）ガンベルホルツマルク（英語版）双曲線正割ジョンソンの S_U（英語版）ランダウラプラス非対称ラプラス（英語版）ロジスティック非心 t 正規 (ガウス) 正規逆ガウス（英語版）歪正規（英語版）スラッシュ安定スチューデントの t タイプ1ガンベル（英語版）トレイシー–ウィダム（英語版）分散ガンマ（英語版）フォークト
連続単変量でタイプの変わる台を持つ	一般極値一般パレート（英語版）マルチェンコ–パストゥール（英語版） q-指数（英語版） q-ガウス q-ワイブル（英語版） shifted log-logistic（英語版）トゥーキーのラムダ（英語版）
混連続-離散単変量	rectified Gaussian（英語版）
多変量 (結合)	【離散】エウェンズ（英語版）多項ディリクレ多項（英語版）負多項（英語版）【連続】ディリクレ一般ディリクレ（英語版）多変量正規多変量安定（英語版）多変量 t（英語版）正規逆ガンマ（英語版）正規ガンマ（英語版）【行列値】逆行列ガンマ（英語版）逆ウィッシャート（英語版）行列正規（英語版）行列 t（英語版）行列ガンマ（英語版）正規逆ウィッシャート（英語版）正規ウィッシャート（英語版）ウィッシャート
方向	【単変量 (円周) 方向】円周一様（英語版）単変数フォン・ミーゼス wrapped 正規（英語版） wrapped コーシー（英語版） wrapped 指数（英語版） wrapped 非対称ラプラス（英語版） wrapped レヴィ（英語版）【二変量 (球面)】ケント（英語版）【二変量 (トロイダル)】二変数フォン・ミーゼス（英語版）【多変量】フォン・ミーゼス–フィッシャー（英語版）ビンガム（英語版）
退化と特異	【退化】ディラックのデルタ関数【特異】カントール
族	円周（英語版）混合ポワソン（英語版）楕円（英語版）指数自然指数（英語版）位置尺度（英語版）最大エントロピー（英語版）混合（英語版）ピアソン（英語版）トウィーディ（英語版） wrapped（英語版）
サンプリング法（英語版）	逆関数サンプリング法マルコフ連鎖モンテカルロ法（メトロポリス・ヘイスティングス法・ギブスサンプリング・スライスサンプリング）粒子フィルタボックス＝ミュラー法棄却サンプリング（英語版）ジッグラト法（英語版）マルサグリア法（英語版）
一覧（英語版）カテゴリ

定義

性質