負の二項分布 (ふのにこうぶんぷ)とは、確率分布 の一種で、二項分布 の拡張。
負の二項分布は、文献によって異なった意味で使われることがある。
(1) 統計的に独立なベルヌーイ試行 を行ったとき、x 回目の試行で k 回目の「成功」が得られた時の x の分布。
(2) 統計的に独立なベルヌーイ試行 を行ったときに、k 回目の「成功」を得るまでに失敗した試行回数 y の分布。
(1) x 回目の試行で k 回目の「成功」が得られた時の x の確率分布
x 回目の試行で k 回目の成功となったのだから、x - 1 回目は必ず失敗している。また、x 回試行したうちの k 回は成功しているのだから、失敗した試行の数は x - k 回。
おのおのの成功する確率を p とすると失敗する確率は (1 - p )。
x 回目の試行は「成功」でなければならないから、成功失敗の順番が決まっていないのは x - 1 回目まで。よって、
P
(
X
=
x
)
=
(
x
−
1
k
−
1
)
p
k
(
1
−
p
)
x
−
k
{\displaystyle P(X=x)={x-1 \choose k-1}p^{k}(1-p)^{x-k}}
となる。
(2) k 回目の「成功」を得るまでに失敗した試行回数 y の確率分布
k 回成功して y 回失敗したので、全試行回数は k + y 回。
また、k + y 回目は「成功」であるので、(1)と同じく成功失敗の組み合わせは k + y - 1 回目までを考え、
P
(
Y
=
y
)
=
(
k
+
y
−
1
y
)
p
k
(
1
−
p
)
y
{\displaystyle P(Y=y)={k+y-1 \choose y}p^{k}(1-p)^{y}}
となる。
(1)と(2)の両式は変数変換
y
=
x
−
k
{\displaystyle y=x-k}
で互いに可換である。
(
n
m
)
=
(
n
n
−
m
)
{\displaystyle {n \choose m}={n \choose n-m}}
に注意すると、
P
(
X
=
x
)
=
(
x
−
1
k
−
1
)
p
k
(
1
−
p
)
x
−
k
=
(
x
−
1
(
x
−
1
)
−
(
k
−
1
)
)
p
k
(
1
−
p
)
x
−
k
=
(
x
−
1
x
−
k
)
p
k
(
1
−
p
)
x
−
k
=
(
y
+
k
−
1
y
)
p
k
(
1
−
p
)
y
=
P
(
Y
=
y
)
{\displaystyle {\begin{aligned}P(X=x)&={x-1 \choose k-1}p^{k}(1-p)^{x-k}\\&={x-1 \choose (x-1)-(k-1)}p^{k}(1-p)^{x-k}\\&={x-1 \choose x-k}p^{k}(1-p)^{x-k}\\&={y+k-1 \choose y}p^{k}(1-p)^{y}\\&=P(Y=y)\end{aligned}}}
(1)式と(2)式では期待値が異なる。
(1)式の場合
E
[
X
]
=
∑
x
=
0
∞
x
P
k
(
x
)
=
∑
x
=
0
∞
x
(
x
−
1
)
(
x
−
2
)
⋯
(
x
−
k
+
1
)
(
k
−
1
)
!
p
k
(
1
−
p
)
x
−
k
=
∑
x
=
k
∞
x
(
x
−
1
)
⋯
(
x
−
k
+
1
)
(
k
−
1
)
!
p
k
(
1
−
p
)
x
−
k
=
k
p
∑
x
=
k
∞
x
(
x
−
1
)
⋯
(
x
−
k
+
1
)
k
!
p
k
+
1
(
1
−
p
)
x
−
k
=
k
p
∑
x
=
k
+
1
∞
(
x
−
1
)
(
x
−
2
)
⋯
(
x
−
k
)
k
!
p
k
+
1
(
1
−
p
)
x
−
k
−
1
=
k
p
∑
x
=
0
∞
P
k
+
1
(
x
)
=
k
p
{\displaystyle {\begin{aligned}E[X]&=\sum _{x=0}^{\infty }xP_{k}(x)\\&=\sum _{x=0}^{\infty }x{\frac {(x-1)(x-2)\cdots (x-k+1)}{(k-1)!}}p^{k}(1-p)^{x-k}\\&=\sum _{x=k}^{\infty }{\frac {x(x-1)\cdots (x-k+1)}{(k-1)!}}p^{k}(1-p)^{x-k}\\&={\frac {k}{p}}\sum _{x=k}^{\infty }{\frac {x(x-1)\cdots (x-k+1)}{k!}}p^{k+1}(1-p)^{x-k}\\&={\frac {k}{p}}\sum _{x=k+1}^{\infty }{\frac {(x-1)(x-2)\cdots (x-k)}{k!}}p^{k+1}(1-p)^{x-k-1}\\&={\frac {k}{p}}\sum _{x=0}^{\infty }P_{k+1}(x)\\&={\frac {k}{p}}\end{aligned}}}
(2)式の場合
E
[
Y
]
=
∑
y
=
0
∞
x
P
k
(
y
)
=
∑
y
=
0
∞
y
(
k
+
y
−
1
)
(
k
+
y
−
2
)
⋯
(
k
+
1
)
k
y
!
p
k
(
1
−
p
)
y
=
∑
y
=
1
∞
(
k
+
y
−
1
)
(
k
+
y
−
2
)
⋯
(
k
+
1
)
k
(
y
−
1
)
!
p
k
(
1
−
p
)
y
=
k
(
1
−
p
)
p
∑
y
=
0
∞
(
k
+
y
)
(
k
+
y
−
1
)
⋯
(
k
+
1
)
y
!
p
k
+
1
(
1
−
p
)
y
=
k
(
1
−
p
)
p
∑
y
=
0
∞
P
k
+
1
(
y
)
=
k
(
1
−
p
)
p
{\displaystyle {\begin{aligned}E[Y]&=\sum _{y=0}^{\infty }xP_{k}(y)\\&=\sum _{y=0}^{\infty }y{\frac {(k+y-1)(k+y-2)\cdots (k+1)k}{y!}}p^{k}(1-p)^{y}\\&=\sum _{y=1}^{\infty }{\frac {(k+y-1)(k+y-2)\cdots (k+1)k}{(y-1)!}}p^{k}(1-p)^{y}\\&=k{\frac {(1-p)}{p}}\sum _{y=0}^{\infty }{\frac {(k+y)(k+y-1)\cdots (k+1)}{y!}}p^{k+1}(1-p)^{y}\\&=k{\frac {(1-p)}{p}}\sum _{y=0}^{\infty }P_{k+1}(y)\\&=k{\frac {(1-p)}{p}}\end{aligned}}}
これらは期待値の線形性
E
[
a
X
+
b
Y
]
=
a
E
[
X
]
+
b
E
[
Y
]
{\displaystyle E[aX+bY]=aE[X]+bE[Y]}
から容易に互いに導ける。
y
=
x
−
k
{\displaystyle y=x-k}
だから、
E
[
Y
]
=
E
[
X
−
k
]
=
E
[
X
]
−
k
{\displaystyle E[Y]=E[X-k]=E[X]-k}
よって
E
[
Y
]
=
k
(
1
−
p
)
p
=
k
−
p
k
p
=
k
p
−
k
=
E
[
X
]
−
k
{\displaystyle {\begin{aligned}E[Y]&=k{\frac {(1-p)}{p}}\\&={\frac {k-pk}{p}}\\&={\frac {k}{p}}-k\\&=E[X]-k\end{aligned}}}
上記のように三つの意味があるので、ここでは最初の意味に絞って解説する。最初の意味では、負の二項分布とは、おのおのの試行で成功する確率が p である独立なベルヌーイ試行を続けておこなったとき、r 回の成功を得るのに必要な試行回数であった。
パラメータ : 成功回数 r は、整数 で、1 ≤ r とする。r = 1 のときの負の二項分布を幾何分布 という。おのおのの試行で成功する確率 p は、0 < p < 1 である実数である。
確率分布関数 r 回の成功を x 回目の試行で達成する確率
f
(
x
)
=
P
(
X
=
x
)
=
(
x
−
1
r
−
1
)
p
r
(
1
−
p
)
x
−
r
{\displaystyle f(x)=P(X=x)={x-1 \choose r-1}p^{r}(1-p)^{x-r}}
累積分布関数 r 回の成功を、x 回目かそれ以前に達成する確率 : 単純な解法は存在しないが、正規化された不完全なベータ関数を使って計算することができる。二項分布
期待値 E(X ) = r / p .
分散 var(X ) = σ2 = r (1 − p ) / p 2 .
[[Category:確率分布|ふのにこうふんふ]]
[[Category:数学に関する記事|ふのにこうふんふ]]