「確率変数の収束」の版間の差分
Kazehikibird (会話 | 投稿記録) en:Convergence of random variables (06:06, 3 November 2012 UTC) の 1 節まで翻訳 |
m 解消済み仮リンク |
||
(2人の利用者による、間の7版が非表示) | |||
22行目: | 22行目: | ||
以下では、(''X''<sub>''n''</sub>) を確率変数列とし、''X'' を確率変数とし、それらすべては同一の[[確率空間]] <math>\scriptstyle (\Omega, \mathcal{F}, P )</math> 上で定義されるものとする。 |
以下では、(''X''<sub>''n''</sub>) を確率変数列とし、''X'' を確率変数とし、それらすべては同一の[[確率空間]] <math>\scriptstyle (\Omega, \mathcal{F}, P )</math> 上で定義されるものとする。 |
||
== 分布収束 == |
|||
{{Infobox |
|||
| title = 分布収束の例 |
|||
| bodystyle = width: 28em; |
|||
| headerstyle = background-color: lightblue; text-align: left; padding-left: 3pt; |
|||
| datastyle = text-align: left; |
|||
| header1 = サイコロ工場 |
|||
| data2 = 新しく建設されたばかりのサイコロ工場について考える。初めの方に作られたサイコロには、その製造過程の不完全さに起因して、偏りがあると考えられる。それらを投げた時に出る目から得られる分布は、理想とする[[一様分布]]とはきわだって異なるものとなるであろう。<br /><br />工場が改善されるにつれてサイコロの偏りは少なくなり、より新しく作られたサイコロを投げた時に出る目は一様分布により近いものとなっていく。 |
|||
| header3 = コイン投げ |
|||
| data4 = 偏りの無いコインを ''n'' 回投げた時に表が出た割合を ''X<sub>n</sub>'' とする。このとき、''X''<sub>1</sub> は期待値 ''μ'' = 0.5 および分散 ''σ''<sup>2</sup> = 0.25 である[[ベルヌーイ分布]]に従う。それ以降の確率変数 ''X''<sub>2</sub>、''X''<sub>3</sub>、… はすべて[[二項分布|二項的に]]分布する。<br /><br />''n'' が大きくなるにつれて、その分布はしだいに[[正規分布]]の釣鐘型曲線に近い形を取るようになる。''X<sub>n</sub>'' を適切にシフトし、リスケールすることによって<math>\scriptstyle Z_n = \sqrt{n}(X_n-\mu)/\sigma</math> は標準正規分布へと'''分布収束'''する。この結果は有名な[[中心極限定理]]によるものである。 |
|||
| header5 = グラフ例 |
|||
| data6 = { ''X''<sub>''i''</sub> } を、[[一様分布|一様]] ''U''(−1,1) 確率変数の{{仮リンク|独立同分布|label=独立同一|en|Independent and identically distributed}}列とする。<math>\scriptstyle Z_n = {\scriptscriptstyle\frac{1}{\sqrt{n}}}\sum_{i=1}^n X_i</math> を、それらの(正規化された)和とする。このとき、[[中心極限定理]]より、''Z<sub>n</sub>'' の分布は標準 ''N''(0, ⅓) 分布へと近付く。この収束を、下図に表す: ''n'' が大きくなるにつれて、pdf 関数はガウス曲線へと近付いていく。 |
|||
[[Image:Convergence in distribution (sum of uniform rvs).gif|center|200px]] |
|||
}} |
|||
このタイプの収束により、ある与えられた[[確率分布]]によってより良くモデル化されるようなランダム実験の列における結果を期待することが出来る。 |
|||
分布収束は、この記事内で述べられる全ての他のタイプの収束も意味するという点において、最も弱い収束である。しかしながら、実際の現場において、分布収束は非常によく利用される; 最もよく現れるのは、[[中心極限定理]]の応用においてである。 |
|||
=== 定義 === |
|||
[[確率変数]]の列 <math>X_1,\ X_2,\ldots</math> が、ある確率変数 ''X'' へと'''分布収束'''する、あるいは'''弱収束'''あるいは'''法則収束'''(converge in law)するとは、 |
|||
: <math> |
|||
\lim_{n\to\infty} F_n(x) = F(x), |
|||
</math> |
|||
が、<math>F</math> が[[連続 (数学)|連続]]であるような全ての数 {{nowrap|''x'' ∈ '''R'''}} に対して成立することを言う。ここで、<math>F_n</math> および <math>F</math> はそれぞれ確率変数 <math>X_n</math> および <math>X</math> の[[累積分布関数]]である。 |
|||
<math>F</math> が連続であるような点のみを考えるということは本質的である。例えば、もし <math>X_n</math> が区間 [0, {{frac|''n''}}] 上[[一様分布|一様に]]分布しているなら、その列は[[退化分布|退化]]確率変数 {{nowrap|''X'' {{=}} 0}} へと収束する。実際、{{nowrap|''x'' ≤ 0}} である時はすべての ''n'' に対して {{nowrap|''F<sub>n</sub>''(''x'') {{=}} 0}} が成り立ち、 {{nowrap|''n'' > 0}} である時はすべての {{nowrap|''x'' ≥ {{frac|''n''}}}} に対して {{nowrap|''F<sub>n</sub>''(''x'') {{=}} 1}} が成り立つ。しかしながら、すべての ''n'' に対して {{nowrap|''F<sub>n</sub>''(0) {{=}} 0}} であるにも関わらず、この極限確率変数に対しては {{nowrap|''F''(0) {{=}} 1}} である。したがって、''F'' が不連続であるような点 {{nowrap|''x'' {{=}} 0}} において累積分布関数の収束は成立しない。 |
|||
分布収束は次のように表記することが出来る。 |
|||
: <math>\begin{align} |
|||
& X_n \ \xrightarrow{d}\ X,\ \ |
|||
X_n \ \xrightarrow{\mathcal{D}}\ X,\ \ |
|||
X_n \ \xrightarrow{\mathcal{L}}\ X,\ \ |
|||
X_n \ \xrightarrow{d}\ \mathcal{L}_X, \\ |
|||
& X_n \rightsquigarrow X,\ \ |
|||
X_n \Rightarrow X,\ \ |
|||
\mathcal{L}(X_n)\to\mathcal{L}(X),\\ |
|||
\end{align}</math> |
|||
ここで <math>\scriptstyle\mathcal{L}_X</math> は <math>X</math> の法則(確率分布)である。例えば、<math>X</math> が標準正規であるなら <math style="height:1.5em;position:relative;top:-.3em">X_n\,\xrightarrow{d}\,\mathcal{N}(0,\,1)</math> と書くことが出来る。 |
|||
{{仮リンク|確率ベクトル|en|random vector}} {''X''<sub>1</sub>, ''X''<sub>2</sub>, …} ⊂ '''R'''<sup>''k''</sup> に対する分布収束も、同様に定義される。この列がある確率 ''k''-ベクトルへと'''分布収束'''するとは、 |
|||
: <math> |
|||
\lim_{n\to\infty} \operatorname{Pr}(X_n\in A) = \operatorname{Pr}(X\in A) |
|||
</math> |
|||
が、''X'' の{{仮リンク|連続集合|en|continuity set}}であるようなすべての ''A'' ⊂ '''R'''<sup>''k''</sup> に対して成立することを言う。 |
|||
分布収束の定義は、確率ベクトルから、任意の[[距離空間]]におけるより複雑な[[確率要素]]や、さらには漸近の場合を除いて可測でない「確率変数」に対してですら拡張される-そのような状況は例えば[[経験過程]]の研究においてあらわれ、これは「定義されていない法則の弱収束」である<ref>{{harvnb|Bickel|Klaassen|Ritov|Wellner|1998|loc=A.8, page 475}}</ref>。 |
|||
この場合、'''弱収束'''という呼び名が好ましい({{仮リンク|測度の弱収束|en|weak convergence of measures}}を参照されたい)。また、確率要素の列 {''X<sub>n</sub>''} が ''X'' へと弱収束する(''X<sub>n</sub>'' ⇒ ''X'' と記述される)とは、 |
|||
: <math> |
|||
\operatorname{E}^*h(X_n) \to \operatorname{E}\,h(X) |
|||
</math> |
|||
がすべての連続有界関数 ''h''(·) に対して成立することを言う<ref>{{harvnb|van der Vaart|Wellner|1996|page=4}}</ref>。ここで E* は外期待値(outer expectation)、すなわち、''h''(''X''<sub>''n''</sub>) を支配するような最小の可測関数 ''g'' の期待値を表す。 |
|||
=== 性質 === |
|||
<ul> |
|||
<li> ''F''(''a'') = Pr(''X'' ≤ ''a'') であることから、分布収束は、十分大きい ''n'' に対して ''X<sub>n</sub>'' がある与えられた領域に含まれる確率と、その領域に ''X'' が含まれる確率がほとんど等しいことを意味する。 |
|||
<li> 一般的に分布収束は、対応する[[確率密度関数]]の列が同様に収束するということは意味しない。その一例として、密度 ''ƒ<sub>n</sub>''(''x'') = (1 − cos(2''πnx''))'''1'''<sub>{''x''∈(0,1)}</sub> を備える確率変数を考える。そのような確率変数は一様分布 ''U''(0, 1) へと分布収束するが、その密度が収束することはない<ref>{{harvnb|Romano|Siegel|1985|loc=Example 5.26}}</ref>。 |
|||
<li>'''{{仮リンク|ポートマントーの補題|en|Portmanteau lemma}}'''では、分布収束のいくつかの同値な定義が述べられている。それらの定義は直感にそぐわないものでもあるかも知れないが、統計学における多くの定理の証明に利用されている。その補題によれば、{''X''<sub>''n''</sub>} が ''X'' へ分布収束するための必要条件は、次のいずれかが成立することである: |
|||
* Eƒ(''X<sub>n</sub>'') → Eƒ(''X'') がすべての{{仮リンク|有界関数|label=有界|en|Bounded function}}な[[連続関数]] ƒ に対して成立する; |
|||
* Eƒ(''X<sub>n</sub>'') → Eƒ(''X'') がすべての有界な[[リプシッツ連続|リプシッツ関数]] ƒ に対して成立する; |
|||
* limsup{ Eƒ(''X<sub>n</sub>'') } ≤ Eƒ(''X'') がすべての[[半連続|上半連続]]かつ上に有界な関数 ƒ に対して成立する; |
|||
* liminf{ Eƒ(''X<sub>n</sub>'') } ≥ Eƒ(''X'') がすべての[[半連続|下半連続]]かつ下に有界な関数 ƒ に対して成立する; |
|||
* limsup{ Pr(''X<sub>n</sub>'' ∈ ''C'') } ≤ Pr(''X'' ∈ ''C'') がすべての[[閉集合]] ''C'' に対して成立する; |
|||
* liminf{ Pr(''X<sub>n</sub>'' ∈ ''U'') } ≥ Pr(''X'' ∈ ''U'') がすべての[[開集合]] ''U'' に対して成立する; |
|||
* lim{ Pr(''X<sub>n</sub>'' ∈ ''A'') } = Pr(''X'' ∈ ''A'') が、すべての確率変数 ''X'' の{{仮リンク|連続集合|en|continuity set}} ''A'' に対して成立する。 |
|||
<li>'''{{仮リンク|連続写像定理|en|Continuous mapping theorem}}'''によると、''g''(·) が連続関数であるとき、確率変数列 {''X''<sub>''n''</sub>} が ''X'' に分布収束するなら、{''g''(''X''<sub>''n''</sub>)} も ''g''(''X'') へと分布収束することが分かる。 |
|||
<li>'''{{仮リンク|レヴィの連続性定理|en|Lévy’s continuity theorem}}''': 確率変数列 {''X''<sub>''n''</sub>} が ''X'' に分布収束するための必要十分条件は、それらに対応する[[特性関数 (確率論)|特性関数]]の列 {''φ<sub>n</sub>''} が ''X'' の特性関数 ''φ'' へと[[各点収束]]することである。 |
|||
<li> 分布収束は[[レヴィ-プロホロフ計量]]によって{{仮リンク|距離化可能|en|metrizable}}である。 |
|||
<li> [[スコロホッドの表現定理]]は、分布収束への自然な拡張である。 |
|||
</ul> |
|||
== 確率収束 == |
|||
{{Infobox |
|||
| title = 確率収束の例 |
|||
| bodystyle = width: 28em; |
|||
| headerstyle = background-color: lightblue; text-align: left; padding-left: 3pt; |
|||
| datastyle = text-align: left; |
|||
| header1 = ある人物の身長 |
|||
| data2 = 次のような実験を考える。はじめに、路上の人の中からランダムに一人選ぶ。その人の身長 ''X'' を、事前に確率変数として定めておく。その後、他の人々に、その人の身長を目算で予測してもらう作業を始める。''X<sub>n</sub>'' を、その人々からの ''n'' 回目の回答までに得られた身長の数字の平均とする。すると([[偏り|バイアス]]が無いならば)[[大数の法則]]により、列 ''X<sub>n</sub>'' はあらかじめ定めた確率変数 ''X'' へと確率収束する。 |
|||
| header3 = 射手 |
|||
| data4 = 人に弓を持たせ、的を目掛けて矢を射させる作業を考える。''X<sub>n</sub>'' を、その人の ''n'' 回目までの[[射的]]の成績とする。初めの内は、その人はとても頻繁に的を外すことも考えられるであろうが、何度も繰り返す内にその人の射的の腕前は向上し、的の中心を射抜いて 10 点の成績を得ることも起こりやすくなるであろう。何年も練習を重ねた後に、その人が 10 点以外の成績を得る可能性はより低くなるであろう。したがって、列 ''X<sub>n</sub>'' は ''X'' = 10 へと確率収束する。<br /><br />ここで ''X<sub>n</sub>'' は、概収束はしないことに注意されたい。その人がどれほど優れた射手であろうと、失敗をする確率はわずかにでも常に存在している。したがって、列 {''X<sub>n</sub>''} は決して定常状態になることは無い。たとえその頻度が少なくなろうと、パーフェクトでない成績は必ずそこに含まれる。 |
|||
}} |
|||
「例外的」な結果が起こる確率は、列が進むにつれてより小さくなる、という考え方が、このタイプの収束の背景にある。 |
|||
確率収束の概念は統計学において非常に頻繁に用いられる。例えば、ある[[推定量]]が[[一致推定量]]であるとは、それが推定された量へと確率収束することを言う。確率収束はまた、[[大数の法則|大数の弱法則]]により確立される収束の一つでもある。 |
|||
=== 定義 === |
|||
確率収束の定義を正式に述べる。任意の ''ε'' > 0 および任意の ''δ'' > 0 を選ぶ。''X'' を中心とする半径 ''ε'' の外側に ''X<sub>n</sub>'' がある確率を ''P''<sub>''n''</sub> とする。このとき、''X''<sub>''n''</sub> が ''X'' へと確率収束するためには、全ての ''n'' ≥ ''N''<sub>''δ''</sub> に対して確率 ''P''<sub>''n''</sub> が ''δ'' より小さくなるような、ある数 ''N''<sub>''δ''</sub> が存在しなければならない。 |
|||
確率収束は、収束を表す矢印に記号 ''p'' を付け加えるか、確率極限作用素 "plim" を使って表される: |
|||
: <math> |
|||
X_n \ \xrightarrow{p}\ X,\ \ |
|||
X_n \ \xrightarrow{P}\ X,\ \ |
|||
\underset{n\to\infty}{\operatorname{plim}}\, X_n = X. |
|||
</math> |
|||
=== 性質 === |
|||
<ul> |
|||
<li>確率収束は、分布収束を意味する<sup>[[:en:Proofs of convergence of random variables#propA2|[proof]]]</sup>。 |
|||
<li>確率収束は、概収束を必ずしも意味しない<sup>[[:en:Proofs of convergence of random variables#propA1i|[proof]]]</sup>。 |
|||
<li>逆に、分布収束が確率収束を意味するためには、極限の確率変数 ''X'' が定数である必要がある<sup>[[:en:Proofs of convergence of random variables#propB1|[proof]]]</sup>。 |
|||
<li>{{仮リンク|連続写像定理|en|continuous mapping theorem}}によると、どのような連続関数 ''g''(·) に対しても、<math style="position:relative;top:-.4em">\scriptstyle X_n\xrightarrow{p}X</math> であるならば <math style="position:relative;top:-.35em">\scriptstyle g(X_n)\xrightarrow{p}g(X)</math> が成立する。 |
|||
<li>確率収束は、ある固定された確率空間に対する確率変数の空間上の[[位相幾何学|位相]]を定義する。この位相は、次に述べる{{仮リンク|カイ・ファン|en|Ky Fan}}計量により[[距離函数|距離化可能]]である<ref>{{harvnb|Dudley|2002|page=289}}</ref>: |
|||
: <math style="position:relative;top:.3em"> |
|||
d(X,Y) = \inf\!\big\{ \varepsilon>0:\ \Pr\big(|X-Y|>\varepsilon\big)\leq\varepsilon\big\} |
|||
</math> |
|||
あるいは |
|||
: <math>d(X,Y)=\mathbb E\left[\min(|X-Y|, 1)\right]</math>. |
|||
</ul> |
|||
== 概収束 == |
|||
{{Infobox |
|||
| title = 概収束の例 |
|||
| bodystyle = width: 28em; |
|||
| headerstyle = background-color: lightblue; text-align:left; |
|||
| datastyle = text-align: left; |
|||
| header1 = 例 1 |
|||
| data2 = 短命の種である一匹の動物について考える。その動物が毎日に摂る食事の数量を記録する。この数量の列は予測不可能であろうが、その値がゼロとなる日は「確かに必ず」訪れるであろう。その値はその後は永遠にゼロであり続ける。 |
|||
| header3 = 例 2 |
|||
| data4 = 毎朝 7 枚のコインを投げる男について考える。その男は、表の出た枚数だけ 1 [[ポンド (貨幣)|ポンド]]貨幣を午後に[[チャリティー]]へと寄付することを日課としているが、全てが裏であった時にはその日課を永遠に止めることに決めている。<br /><br />''X''<sub>1</sub>、''X''<sub>2</sub> … を、そのチャリティーが彼から受け取る日々の金額とする。<br /><br />その金額がゼロとなり、またその後もゼロであり続けるような日が訪れることは「ほとんど確かに」予想できるであろう。<br /><br />しかし、コインを投げる日が有限であるのなら、そのような終了条件が起こらない確率もゼロではない。 |
|||
}} |
|||
概収束は、初等的な[[実解析]]の分野で知られる[[各点収束]]の概念とほぼ同様な、確率収束の一つの型である。 |
|||
=== 定義 === |
|||
確率変数列 ''X''<sub>''n''</sub> が ''X'' へと'''概収束'''あるいは'''ほとんど確実に収束'''、'''ほとんど至る所で収束'''、'''確率 1 で収束'''あるいは'''強収束'''するとは、 |
|||
: <math> |
|||
\operatorname{Pr}\!\left( \lim_{n\to\infty}\! X_n = X \right) = 1 |
|||
</math> |
|||
が成立することを言う。 |
|||
上式は、''X''<sub>''n''</sub> が ''X'' へと収束しない事象が起きる確率が 0 であるという意味で、''X''<sub>''n''</sub> の値が ''X'' の値へと近付くことを意味する([[ほとんど (数学)]]も参照)。確率空間 <math>\scriptstyle (\Omega, \mathcal{F}, P )</math> を定め、Ω から '''R''' への関数としての確率変数の概念を利用することで、上式は |
|||
: <math> |
|||
\operatorname{Pr}\Big( \omega \in \Omega : \lim_{n \to \infty} X_n(\omega) = X(\omega) \Big) = 1 |
|||
</math> |
|||
と同値となる。 |
|||
また概収束の同値な定義には、以下もある: |
|||
: <math> |
|||
\operatorname{Pr}\Big( \liminf \big\{\omega \in \Omega : | X_n(\omega) - X(\omega) | < \varepsilon \big\} \Big) = 1 \quad\text{for all}\quad \varepsilon>0. |
|||
</math> |
|||
概収束は、しばしば、収束を表す矢印の上に記号 ''a.s.'' (almost surelyの略)を付け加えることによって表現される: |
|||
: <math> |
|||
X_n \, \xrightarrow{\mathrm{a.s.}} \, X. |
|||
</math> |
|||
[[距離空間]] (''S'', ''d'') 上の一般的な[[確率要素]] {''X<sub>n</sub>''} に対しても、同様に概収束が定義される: |
|||
: <math> |
|||
\operatorname{Pr}\Big( \omega\in\Omega:\, d\big(X_n(\omega),X(\omega)\big)\,\underset{n\to\infty}{\longrightarrow}\,0 \Big) = 1 |
|||
</math> |
|||
=== 性質 === |
|||
* 概収束は確率収束を意味し、したがって分布収束を意味する。[[大数の法則|大数の強法則]]で用いられる概念は、概収束である。 |
|||
* 概収束の概念は、確率変数の空間上の[[位相幾何学|トポロジー]]から生じるものではない。このことは、概収束がそのトポロジーに関する収束列と全く等しいような確率変数の空間上のトポロジーというものは存在しないことを意味する。特に、概収束には計量が無い。 |
|||
== 確実収束 == |
|||
ある[[確率空間]]上定義される列あるいは確率変数 (''X''<sub>''n''</sub>)(すなわち、[[確率過程]])が ''X'' へ'''確実収束'''(sure convergence)あるいは'''各点収束'''するとは、 |
|||
:<math>\lim_{n\rightarrow\infty}X_n(\omega)=X(\omega), \, \, \forall \omega \in \Omega </math> |
|||
が成立することを言う。ここで Ω は、確率変数が定義される[[確率空間]]に含まれる[[標本空間]]である。 |
|||
これは、関数列の[[各点収束]]の概念を[[確率変数]]の列へと拡張したものである(確率変数はそれ自身が関数であることに注意されたい)。 |
|||
:<math>\big\{\omega \in \Omega \, | \, \lim_{n \to \infty}X_n(\omega) = X(\omega) \big\} = \Omega.</math> |
|||
確率変数の確実収束は、上述の他の全ての収束を意味する。しかし、概収束の代わりに確実収束を用いることのメリットは[[確率論]]においてはあまり無い。それら二つの収束の違いは、確率ゼロの集合に関する点のみに存在する。このことが、確実収束の概念が滅多に用いられることの無い理由である。 |
|||
== 平均収束 == |
|||
ある {{nowrap|''r'' ≥ 1}} に対し、列 ''X<sub>n</sub>'' が ''X'' へと ''r''次平均収束(あるいは、{{仮リンク|Lp空間|label=''L<sup>r</sup>''-ノルム|en|Lp space}}について収束)するとは、''X<sub>n</sub>'' および ''X'' の ''r''次[[絶対積率]]が存在し、かつ |
|||
: <math> |
|||
\lim_{n\to\infty} \operatorname{E}\left( |X_n-X|^r \right) = 0 |
|||
</math> |
|||
が成立することを言う。ここで作用素 E は[[期待値]]を表す。''r''次平均収束は、''X<sub>n</sub>'' と ''X'' の差の ''r''次のべきの期待値がゼロへと収束することを意味する。 |
|||
この種の収束はしばしば、収束を表す矢の上に記号 ''L<sup>r</sup>'' を付け加えることで表現される: |
|||
: <math>X_n \, \xrightarrow{L^r} \, X.</math> |
|||
''r''次平均収束に関して重要なケースを下に挙げる: |
|||
* ''r'' = 1 について ''X''<sub>''n''</sub> が ''X'' へと ''r''次平均収束するとき、''X''<sub>''n''</sub> は ''X'' へ'''平均収束'''すると言われる。 |
|||
* ''r'' = 2 について ''X''<sub>''n''</sub> が ''X'' へと ''r''次平均収束するとき、''X''<sub>''n''</sub> は ''X'' へ'''二乗平均収束'''すると言われる。この収束はまた次のように記述されることもある<ref>{{cite book | last = Porat | first = B. | title = Digital Processing of Random Signals: Theory & Methods | year = 1994 | publisher = Prentice Hall | isbn = 0-13-063751-3 | pages=19 }}</ref>: |
|||
:: <math>\underset{n \to \infty}{\operatorname{l.i.m.}} X_n = X.\,\!</math> |
|||
''r'' > 0 に関する ''r''次平均収束は、([[マルコフの不等式]]により)確率収束を意味する。また、''r'' > ''s'' ≥ 1 である時、''r''次平均収束は ''s''次平均収束を意味する。このことから、二乗平均収束は平均収束を意味することが分かる。 |
|||
== 性質 == |
|||
様々な収束の概念の間の包含関係を以下に記述する。それらは、矢の記号を使うことで、次のように表される: |
|||
: <math>\begin{matrix} |
|||
\xrightarrow{L^s} & \underset{s>r\geq1}{\Rightarrow} & \xrightarrow{L^r} & & \\ |
|||
& & \Downarrow & & \\ |
|||
\xrightarrow{a.s.} & \Rightarrow & \xrightarrow{\ p\ } & \Rightarrow & \xrightarrow{\ d\ } |
|||
\end{matrix}</math> |
|||
いくつかの特別な場合とともに、これらの性質を次のようにまとめる: |
|||
<ul> |
|||
<li> |
|||
概収束は、確率収束を意味する<ref name="vdv2">{{harvnb|van der Vaart|1998|loc=Theorem 2.7}}</ref><sup>[[:en:Proofs of convergence of random variables#propA1|[proof]]]</sup>: |
|||
: <math> |
|||
X_n\ \xrightarrow{as}\ X \quad\Rightarrow\quad X_n\ \xrightarrow{p}\ X |
|||
</math> |
|||
<li> |
|||
確率収束は、概収束するような部分列 <math>(k_n)</math> が存在することを意味する<ref>{{cite book|last=Gut|first=Allan|title=Probability: A graduate course|year=2005|publisher=Springer|location=Theorem 3.4|isbn=0-387-22833-0}}</ref>: |
|||
: <math> |
|||
X_n\ \xrightarrow{p}\ X \quad\Rightarrow\quad X_{k_n}\ \xrightarrow{as}\ X |
|||
</math> |
|||
<li> |
|||
確率収束は、分布収束を意味する<ref name="vdv2"/><sup>[[:en:Proofs of convergence of random variables#propA2|[proof]]]</sup>: |
|||
: <math> |
|||
X_n\ \xrightarrow{p}\ X \quad\Rightarrow\quad X_n\ \xrightarrow{d}\ X |
|||
</math> |
|||
<li> |
|||
''r''次平均収束は、確率収束を意味する: |
|||
: <math> |
|||
X_n\ \xrightarrow{L^r}\ X \quad\Rightarrow\quad X_n\ \xrightarrow{p}\ X |
|||
</math> |
|||
<li> |
|||
''r''次平均収束は、より低次(ただしそれらはいずれも 1 より大きいものとする)の平均収束を意味する: |
|||
: <math> |
|||
X_n\ \xrightarrow{L^r}\ X \quad\Rightarrow\quad X_n\ \xrightarrow{L^s}\ X, |
|||
</math> <span style="position:relative;top:.4em;left:2em;">provided ''r'' ≥ ''s'' ≥ 1.</span> |
|||
<li> |
|||
''X''<sub>''n''</sub> が定数 ''c'' へと分布収束するなら、''X''<sub>''n''</sub> は ''c'' へと確率収束する<ref name="vdv2"/><sup>[[:en:Proofs of convergence of random variables#propB1|[proof]]]</sup>: |
|||
: <math> |
|||
X_n\ \xrightarrow{d}\ c \quad\Rightarrow\quad X_n\ \xrightarrow{p}\ c, |
|||
</math> <span style="position:relative;top:.4em;left:2em;">provided ''c'' is a constant.</span> |
|||
<li> |
|||
''X<sub>n</sub>'' が ''X'' へと分布収束し、''X<sub>n</sub>'' と ''Y<sub>n</sub>'' の差がゼロへと確率収束するなら、''Y<sub>n</sub>'' もまた ''X'' へ分布収束する<ref name="vdv2"/><sup>[[:en:Proofs of convergence of random variables#propB2|[proof]]]</sup>: |
|||
: <math> |
|||
X_n\ \xrightarrow{d}\ X,\ \ |X_n-Y_n|\ \xrightarrow{p}\ 0\ \quad\Rightarrow\quad Y_n\ \xrightarrow{d}\ X |
|||
</math> |
|||
<li> |
|||
''X<sub>n</sub>'' が ''X'' へ分布収束し、''Y<sub>n</sub>'' が定数 ''c'' へ分布収束するなら、それらの結合ベクトル (''X''<sub>''n''</sub>, ''Y''<sub>''n''</sub>) は ''(X, c)'' へ分布収束する<ref name="vdv2"/><sup>[[:en:Proofs of convergence of random variables#propB3|[proof]]]</sup>: |
|||
: <math> |
|||
X_n\ \xrightarrow{d}\ X,\ \ Y_n\ \xrightarrow{d}\ c\ \quad\Rightarrow\quad (X_n,Y_n)\ \xrightarrow{d}\ (X,c) |
|||
</math> <span style="position:relative;top:.4em;left:2em;">provided ''c'' is a constant.</span> |
|||
ここで ''Y<sub>n</sub>'' が定数へ収束するという条件が重要であることに注意されたい。もしその収束がある確率変数 ''Y'' へのものであったら、(''X''<sub>''n''</sub>, ''Y''<sub>''n''</sub>) が ''(X, Y)'' へ収束するという結論は得られない。 |
|||
<li> |
|||
''X<sub>n</sub>'' が ''X'' へ確率収束し、''Y<sub>n</sub>'' が ''Y'' へ確率収束するなら、それらの結合ベクトル (''X''<sub>''n''</sub>, ''Y''<sub>''n''</sub>) は (''X'', ''Y'') へ確率収束する<ref name="vdv2"/><sup>[[:en:Proofs of convergence of random variables#propB4|[proof]]]</sup>: |
|||
: <math> |
|||
X_n\ \xrightarrow{p}\ X,\ \ Y_n\ \xrightarrow{p}\ Y\ \quad\Rightarrow\quad (X_n,Y_n)\ \xrightarrow{p}\ (X,Y) |
|||
</math> |
|||
</ul> |
|||
* ''X''<sub>''n''</sub> が ''X'' へ確率収束し、すべての ''n'' およびある ''b'' に対して {{nowrap|'''P'''({{!}}''X<sub>n</sub>''{{!}} ≤ ''b'') {{=}} 1}} が成立するなら、''X''<sub>''n''</sub> はすべての ''r'' ≥ 1 に対して ''X'' へと ''r''次平均収束する。言い換えると、''X''<sub>''n''</sub> が ''X'' へと確率収束し、すべての ''X''<sub>''n''</sub> がほとんど確実に上下とも有界であるなら、''X''<sub>''n''</sub> は任意の ''r'' について ''X'' へ ''r''次平均収束する。 |
|||
* '''概収束表現'''. 通常、分布収束は概収束を意味するものではない。しかし、''X''<sub>0</sub> へ分布収束するある与えられた列 {''X<sub>n</sub>''} に対しては、新しい確率空間 (Ω, ''F'', P) とその上で定義される確率変数 {''Y<sub>n</sub>'', ''n'' = 0,1,…} で、各 ''n'' ≥ 0 に対して ''Y<sub>n</sub>'' は分布として ''X<sub>n</sub>'' に等しく、また ''Y<sub>n</sub>'' は ''Y''<sub>0</sub> へと概収束するようなものを見つけることが常に可能である<ref>{{harvnb|van der Vaart|1998|loc=Th.2.19}}</ref>。 |
|||
* すべての ''ε'' > 0 に対して |
|||
::<math>\sum_n \mathbb{P} \left(|X_n - X| > \varepsilon\right) < \infty</math> |
|||
:であるなら、''X''<sub>''n''</sub> は ''X'' へとほとんど完全に(almost completely)収束すると言われる。''X''<sub>''n''</sub> が ''X'' へほとんど完全に収束するなら、それはまた ''X'' へ概収束もする。言い換えると、もし ''X''<sub>''n''</sub> が十分に早く ''X'' へ確率収束する(すなわち、上述の末尾確率の列が任意の ''ε'' > 0 に対して直和可能である)なら、''X''<sub>''n''</sub> は ''X'' へ概収束もする。これは、{{仮リンク|ボレル・カンテリの補題|en|Borel-Cantelli lemma}}からの直接的な帰結である。 |
|||
* ''S''<sub>''n''</sub> を ''n'' 個の実独立な確率変数の和 |
|||
::<math>S_n = X_1+\cdots+X_n \, </math> |
|||
:としたとき、''S''<sub>''n''</sub> が概収束することと確率収束することは同値である。 |
|||
* [[優収束定理]]は、概収束が ''L''<sup>1</sup>-収束を意味するための十分条件を与える: |
|||
::<math> |
|||
\left. \begin{array}{ccc} |
|||
X_n\xrightarrow{a.s.} X |
|||
\\ \\ |
|||
|X_n| < Y |
|||
\\ \\ |
|||
\mathrm{E}(Y) < \infty |
|||
\end{array}\right\} \quad\Rightarrow \quad X_n\xrightarrow{L^1} X |
|||
</math> |
|||
* ''L''<sup>1</sup> 収束のための必要十分条件は、<math>X_n\xrightarrow{P} X</math> かつ列 (''X<sub>n</sub>'') が[[一様可積分性|一様可積分]]であることである。 |
|||
== 関連項目 == |
== 関連項目 == |
||
33行目: | 331行目: | ||
* {{仮リンク|漸近分布|en|Asymptotic distribution}} |
* {{仮リンク|漸近分布|en|Asymptotic distribution}} |
||
* {{仮リンク|確率論における大文字Oの表記|en|Big O in probability notation}} |
* {{仮リンク|確率論における大文字Oの表記|en|Big O in probability notation}} |
||
* |
* [[スコロホッドの表現定理]] |
||
== 脚注 == |
== 脚注 == |
2012年12月8日 (土) 09:21時点における版
数学の確率論の分野において、確率変数の収束(かくりつへんすうのしゅうそく、英: convergence of random variables)に関しては、いくつかの異なる概念がある。確率変数列のある極限への収束は、確率論や、その応用としての統計学や確率過程の研究における重要な概念の一つである。より一般的な数学において同様の概念は確率収束(stochastic convergence)として知られ、その概念は、本質的にランダムあるいは予測不可能な事象の列は、その列から十分離れているアイテムを研究する場合において、しばしば、本質的に不変な挙動へと落ち着くことが予想されることがある、という考えを定式化するものである。異なる収束の概念とは、そのような挙動の特徴づけに関連するものである:すぐに分かる二つの挙動とは、その列が最終的に定数となるか、あるいはその列に含まれる値は変動を続けるがある不変な確率分布によってその変動が表現される、というようなものである。
背景
「確率収束」とは、本質的にランダムあるいは予測不可能である事象の列がしばしばあるパターンへと落ち着くことが期待される、という考えを定式化するものである。そのパターンとは、例えば、
- ある固定値や、ある確率事象から発生するそれ自身への、古典的な意味での収束
- 純粋な決定論的な関数から生じる結果への相似性の増加
- ある特定の結果への嗜好の増加
- ある特定の結果から離れていることに対する反発の増加
などが挙げられる。それより明白ではないが、より理論的なパターンとしては
- 次の結果を表現する確率分布が、ある分布へとより似るようになること
- ある特定の値から離れた結果の期待値を計算することによって形成される列が 0 へと収束すること
- 次の事象を表現する確率変数の分散がより少なくなっていくこと
などが挙げられる。これらの起こりうる異なるタイプのパターンは、研究されている異なるタイプの確率収束において反映される。
上述の議論は一つの列の一つの極限値への収束と関連しているが、二つの列が互いへと収束する概念も重要である。しかし、それは、それら二つの列の差や比によって定義される列を研究することによって容易に扱うことが出来る。
例えば、等しい有限の平均と分散を持つような n 個の無相関確率変数 Yi, i = 1, ..., n の平均が
で与えられるとすると、n が無限大へと近付く時、Xn は確率変数 Yi の共通の平均 μ へと確率収束(下記参照)する。この結果は大数の弱法則として知られる。別のタイプの収束は、中心極限定理を含む別の有用な定理において重要となる。
以下では、(Xn) を確率変数列とし、X を確率変数とし、それらすべては同一の確率空間 上で定義されるものとする。
分布収束
サイコロ工場 | |
---|---|
新しく建設されたばかりのサイコロ工場について考える。初めの方に作られたサイコロには、その製造過程の不完全さに起因して、偏りがあると考えられる。それらを投げた時に出る目から得られる分布は、理想とする一様分布とはきわだって異なるものとなるであろう。 工場が改善されるにつれてサイコロの偏りは少なくなり、より新しく作られたサイコロを投げた時に出る目は一様分布により近いものとなっていく。 | |
コイン投げ | |
偏りの無いコインを n 回投げた時に表が出た割合を Xn とする。このとき、X1 は期待値 μ = 0.5 および分散 σ2 = 0.25 であるベルヌーイ分布に従う。それ以降の確率変数 X2、X3、… はすべて二項的に分布する。 n が大きくなるにつれて、その分布はしだいに正規分布の釣鐘型曲線に近い形を取るようになる。Xn を適切にシフトし、リスケールすることによって は標準正規分布へと分布収束する。この結果は有名な中心極限定理によるものである。 | |
グラフ例 | |
{ Xi } を、一様 U(−1,1) 確率変数の独立同一列とする。 を、それらの(正規化された)和とする。このとき、中心極限定理より、Zn の分布は標準 N(0, ⅓) 分布へと近付く。この収束を、下図に表す: n が大きくなるにつれて、pdf 関数はガウス曲線へと近付いていく。 |
このタイプの収束により、ある与えられた確率分布によってより良くモデル化されるようなランダム実験の列における結果を期待することが出来る。
分布収束は、この記事内で述べられる全ての他のタイプの収束も意味するという点において、最も弱い収束である。しかしながら、実際の現場において、分布収束は非常によく利用される; 最もよく現れるのは、中心極限定理の応用においてである。
定義
確率変数の列 が、ある確率変数 X へと分布収束する、あるいは弱収束あるいは法則収束(converge in law)するとは、
が、 が連続であるような全ての数 x ∈ R に対して成立することを言う。ここで、 および はそれぞれ確率変数 および の累積分布関数である。
が連続であるような点のみを考えるということは本質的である。例えば、もし が区間 [0, 1⁄n] 上一様に分布しているなら、その列は退化確率変数 X = 0 へと収束する。実際、x ≤ 0 である時はすべての n に対して Fn(x) = 0 が成り立ち、 n > 0 である時はすべての x ≥ 1⁄n に対して Fn(x) = 1 が成り立つ。しかしながら、すべての n に対して Fn(0) = 0 であるにも関わらず、この極限確率変数に対しては F(0) = 1 である。したがって、F が不連続であるような点 x = 0 において累積分布関数の収束は成立しない。
分布収束は次のように表記することが出来る。
ここで は の法則(確率分布)である。例えば、 が標準正規であるなら と書くことが出来る。
確率ベクトル {X1, X2, …} ⊂ Rk に対する分布収束も、同様に定義される。この列がある確率 k-ベクトルへと分布収束するとは、
が、X の連続集合であるようなすべての A ⊂ Rk に対して成立することを言う。
分布収束の定義は、確率ベクトルから、任意の距離空間におけるより複雑な確率要素や、さらには漸近の場合を除いて可測でない「確率変数」に対してですら拡張される-そのような状況は例えば経験過程の研究においてあらわれ、これは「定義されていない法則の弱収束」である[1]。
この場合、弱収束という呼び名が好ましい(測度の弱収束を参照されたい)。また、確率要素の列 {Xn} が X へと弱収束する(Xn ⇒ X と記述される)とは、
がすべての連続有界関数 h(·) に対して成立することを言う[2]。ここで E* は外期待値(outer expectation)、すなわち、h(Xn) を支配するような最小の可測関数 g の期待値を表す。
性質
- F(a) = Pr(X ≤ a) であることから、分布収束は、十分大きい n に対して Xn がある与えられた領域に含まれる確率と、その領域に X が含まれる確率がほとんど等しいことを意味する。
- 一般的に分布収束は、対応する確率密度関数の列が同様に収束するということは意味しない。その一例として、密度 ƒn(x) = (1 − cos(2πnx))1{x∈(0,1)} を備える確率変数を考える。そのような確率変数は一様分布 U(0, 1) へと分布収束するが、その密度が収束することはない[3]。
- ポートマントーの補題では、分布収束のいくつかの同値な定義が述べられている。それらの定義は直感にそぐわないものでもあるかも知れないが、統計学における多くの定理の証明に利用されている。その補題によれば、{Xn} が X へ分布収束するための必要条件は、次のいずれかが成立することである:
- Eƒ(Xn) → Eƒ(X) がすべての有界な連続関数 ƒ に対して成立する;
- Eƒ(Xn) → Eƒ(X) がすべての有界なリプシッツ関数 ƒ に対して成立する;
- limsup{ Eƒ(Xn) } ≤ Eƒ(X) がすべての上半連続かつ上に有界な関数 ƒ に対して成立する;
- liminf{ Eƒ(Xn) } ≥ Eƒ(X) がすべての下半連続かつ下に有界な関数 ƒ に対して成立する;
- limsup{ Pr(Xn ∈ C) } ≤ Pr(X ∈ C) がすべての閉集合 C に対して成立する;
- liminf{ Pr(Xn ∈ U) } ≥ Pr(X ∈ U) がすべての開集合 U に対して成立する;
- lim{ Pr(Xn ∈ A) } = Pr(X ∈ A) が、すべての確率変数 X の連続集合 A に対して成立する。
- 連続写像定理によると、g(·) が連続関数であるとき、確率変数列 {Xn} が X に分布収束するなら、{g(Xn)} も g(X) へと分布収束することが分かる。
- レヴィの連続性定理: 確率変数列 {Xn} が X に分布収束するための必要十分条件は、それらに対応する特性関数の列 {φn} が X の特性関数 φ へと各点収束することである。
- 分布収束はレヴィ-プロホロフ計量によって距離化可能である。
- スコロホッドの表現定理は、分布収束への自然な拡張である。
確率収束
ある人物の身長 | |
---|---|
次のような実験を考える。はじめに、路上の人の中からランダムに一人選ぶ。その人の身長 X を、事前に確率変数として定めておく。その後、他の人々に、その人の身長を目算で予測してもらう作業を始める。Xn を、その人々からの n 回目の回答までに得られた身長の数字の平均とする。すると(バイアスが無いならば)大数の法則により、列 Xn はあらかじめ定めた確率変数 X へと確率収束する。 | |
射手 | |
人に弓を持たせ、的を目掛けて矢を射させる作業を考える。Xn を、その人の n 回目までの射的の成績とする。初めの内は、その人はとても頻繁に的を外すことも考えられるであろうが、何度も繰り返す内にその人の射的の腕前は向上し、的の中心を射抜いて 10 点の成績を得ることも起こりやすくなるであろう。何年も練習を重ねた後に、その人が 10 点以外の成績を得る可能性はより低くなるであろう。したがって、列 Xn は X = 10 へと確率収束する。 ここで Xn は、概収束はしないことに注意されたい。その人がどれほど優れた射手であろうと、失敗をする確率はわずかにでも常に存在している。したがって、列 {Xn} は決して定常状態になることは無い。たとえその頻度が少なくなろうと、パーフェクトでない成績は必ずそこに含まれる。 |
「例外的」な結果が起こる確率は、列が進むにつれてより小さくなる、という考え方が、このタイプの収束の背景にある。
確率収束の概念は統計学において非常に頻繁に用いられる。例えば、ある推定量が一致推定量であるとは、それが推定された量へと確率収束することを言う。確率収束はまた、大数の弱法則により確立される収束の一つでもある。
定義
確率収束の定義を正式に述べる。任意の ε > 0 および任意の δ > 0 を選ぶ。X を中心とする半径 ε の外側に Xn がある確率を Pn とする。このとき、Xn が X へと確率収束するためには、全ての n ≥ Nδ に対して確率 Pn が δ より小さくなるような、ある数 Nδ が存在しなければならない。
確率収束は、収束を表す矢印に記号 p を付け加えるか、確率極限作用素 "plim" を使って表される:
性質
- 確率収束は、分布収束を意味する[proof]。
- 確率収束は、概収束を必ずしも意味しない[proof]。
- 逆に、分布収束が確率収束を意味するためには、極限の確率変数 X が定数である必要がある[proof]。
- 連続写像定理によると、どのような連続関数 g(·) に対しても、 であるならば が成立する。
- 確率収束は、ある固定された確率空間に対する確率変数の空間上の位相を定義する。この位相は、次に述べるカイ・ファン計量により距離化可能である[4]:
- .
概収束
例 1 | |
---|---|
短命の種である一匹の動物について考える。その動物が毎日に摂る食事の数量を記録する。この数量の列は予測不可能であろうが、その値がゼロとなる日は「確かに必ず」訪れるであろう。その値はその後は永遠にゼロであり続ける。 | |
例 2 | |
毎朝 7 枚のコインを投げる男について考える。その男は、表の出た枚数だけ 1 ポンド貨幣を午後にチャリティーへと寄付することを日課としているが、全てが裏であった時にはその日課を永遠に止めることに決めている。 X1、X2 … を、そのチャリティーが彼から受け取る日々の金額とする。 その金額がゼロとなり、またその後もゼロであり続けるような日が訪れることは「ほとんど確かに」予想できるであろう。 しかし、コインを投げる日が有限であるのなら、そのような終了条件が起こらない確率もゼロではない。 |
概収束は、初等的な実解析の分野で知られる各点収束の概念とほぼ同様な、確率収束の一つの型である。
定義
確率変数列 Xn が X へと概収束あるいはほとんど確実に収束、ほとんど至る所で収束、確率 1 で収束あるいは強収束するとは、
が成立することを言う。
上式は、Xn が X へと収束しない事象が起きる確率が 0 であるという意味で、Xn の値が X の値へと近付くことを意味する(ほとんど (数学)も参照)。確率空間 を定め、Ω から R への関数としての確率変数の概念を利用することで、上式は
と同値となる。
また概収束の同値な定義には、以下もある:
概収束は、しばしば、収束を表す矢印の上に記号 a.s. (almost surelyの略)を付け加えることによって表現される:
距離空間 (S, d) 上の一般的な確率要素 {Xn} に対しても、同様に概収束が定義される:
性質
- 概収束は確率収束を意味し、したがって分布収束を意味する。大数の強法則で用いられる概念は、概収束である。
- 概収束の概念は、確率変数の空間上のトポロジーから生じるものではない。このことは、概収束がそのトポロジーに関する収束列と全く等しいような確率変数の空間上のトポロジーというものは存在しないことを意味する。特に、概収束には計量が無い。
確実収束
ある確率空間上定義される列あるいは確率変数 (Xn)(すなわち、確率過程)が X へ確実収束(sure convergence)あるいは各点収束するとは、
が成立することを言う。ここで Ω は、確率変数が定義される確率空間に含まれる標本空間である。
これは、関数列の各点収束の概念を確率変数の列へと拡張したものである(確率変数はそれ自身が関数であることに注意されたい)。
確率変数の確実収束は、上述の他の全ての収束を意味する。しかし、概収束の代わりに確実収束を用いることのメリットは確率論においてはあまり無い。それら二つの収束の違いは、確率ゼロの集合に関する点のみに存在する。このことが、確実収束の概念が滅多に用いられることの無い理由である。
平均収束
ある r ≥ 1 に対し、列 Xn が X へと r次平均収束(あるいは、Lr-ノルムについて収束)するとは、Xn および X の r次絶対積率が存在し、かつ
が成立することを言う。ここで作用素 E は期待値を表す。r次平均収束は、Xn と X の差の r次のべきの期待値がゼロへと収束することを意味する。
この種の収束はしばしば、収束を表す矢の上に記号 Lr を付け加えることで表現される:
r次平均収束に関して重要なケースを下に挙げる:
- r = 1 について Xn が X へと r次平均収束するとき、Xn は X へ平均収束すると言われる。
- r = 2 について Xn が X へと r次平均収束するとき、Xn は X へ二乗平均収束すると言われる。この収束はまた次のように記述されることもある[5]:
r > 0 に関する r次平均収束は、(マルコフの不等式により)確率収束を意味する。また、r > s ≥ 1 である時、r次平均収束は s次平均収束を意味する。このことから、二乗平均収束は平均収束を意味することが分かる。
性質
様々な収束の概念の間の包含関係を以下に記述する。それらは、矢の記号を使うことで、次のように表される:
いくつかの特別な場合とともに、これらの性質を次のようにまとめる:
-
概収束は、確率収束を意味する[6][proof]:
-
確率収束は、概収束するような部分列 が存在することを意味する[7]:
-
確率収束は、分布収束を意味する[6][proof]:
-
r次平均収束は、確率収束を意味する:
-
r次平均収束は、より低次(ただしそれらはいずれも 1 より大きいものとする)の平均収束を意味する:
- provided r ≥ s ≥ 1.
-
Xn が定数 c へと分布収束するなら、Xn は c へと確率収束する[6][proof]:
- provided c is a constant.
-
Xn が X へと分布収束し、Xn と Yn の差がゼロへと確率収束するなら、Yn もまた X へ分布収束する[6][proof]:
-
Xn が X へ分布収束し、Yn が定数 c へ分布収束するなら、それらの結合ベクトル (Xn, Yn) は (X, c) へ分布収束する[6][proof]:
- provided c is a constant.
-
Xn が X へ確率収束し、Yn が Y へ確率収束するなら、それらの結合ベクトル (Xn, Yn) は (X, Y) へ確率収束する[6][proof]:
- Xn が X へ確率収束し、すべての n およびある b に対して P(|Xn| ≤ b) = 1 が成立するなら、Xn はすべての r ≥ 1 に対して X へと r次平均収束する。言い換えると、Xn が X へと確率収束し、すべての Xn がほとんど確実に上下とも有界であるなら、Xn は任意の r について X へ r次平均収束する。
- 概収束表現. 通常、分布収束は概収束を意味するものではない。しかし、X0 へ分布収束するある与えられた列 {Xn} に対しては、新しい確率空間 (Ω, F, P) とその上で定義される確率変数 {Yn, n = 0,1,…} で、各 n ≥ 0 に対して Yn は分布として Xn に等しく、また Yn は Y0 へと概収束するようなものを見つけることが常に可能である[8]。
- すべての ε > 0 に対して
- であるなら、Xn は X へとほとんど完全に(almost completely)収束すると言われる。Xn が X へほとんど完全に収束するなら、それはまた X へ概収束もする。言い換えると、もし Xn が十分に早く X へ確率収束する(すなわち、上述の末尾確率の列が任意の ε > 0 に対して直和可能である)なら、Xn は X へ概収束もする。これは、ボレル・カンテリの補題からの直接的な帰結である。
- Sn を n 個の実独立な確率変数の和
- としたとき、Sn が概収束することと確率収束することは同値である。
- 優収束定理は、概収束が L1-収束を意味するための十分条件を与える:
- L1 収束のための必要十分条件は、 かつ列 (Xn) が一様可積分であることである。
関連項目
- 測度の収束
- 連続確率過程:確率過程の連続性についての問題は、本質的には、収束や、多くの同様の概念や関係についての問題である。
- 漸近分布
- 確率論における大文字Oの表記
- スコロホッドの表現定理
脚注
- ^ Bickel et al. 1998, A.8, page 475
- ^ van der Vaart & Wellner 1996, p. 4
- ^ Romano & Siegel 1985, Example 5.26
- ^ Dudley 2002, p. 289
- ^ Porat, B. (1994). Digital Processing of Random Signals: Theory & Methods. Prentice Hall. pp. 19. ISBN 0-13-063751-3
- ^ a b c d e f van der Vaart 1998, Theorem 2.7
- ^ Gut, Allan (2005). Probability: A graduate course. Theorem 3.4: Springer. ISBN 0-387-22833-0
- ^ van der Vaart 1998, Th.2.19
参考文献
- Bickel, Peter J.; Klaassen, Chris A.J.; Ritov, Ya’acov; Wellner, Jon A. (1998). Efficient and adaptive estimation for semiparametric models. New York: Springer-Verlag. ISBN 0-387-98473-9. LCCN QA27-6800
- Billingsley, Patrick (1986). Probability and Measure. Wiley Series in Probability and Mathematical Statistics (2nd ed.). Wiley
- Billingsley, Patrick (1999). Convergence of probability measures (2nd ed.). John Wiley & Sons. pp. 1–28. ISBN 0-471-19745-9
- Dudley, R.M. (2002). Real analysis and probability. Cambridge, UK: Cambridge University Press. ISBN 0-521-80972-X
- Grimmett, G.R.; Stirzaker, D.R. (1992). Probability and random processes (2nd ed.). Clarendon Press, Oxford. pp. 271–285. ISBN 0-19-853665-8
- Jacobsen, M. (1992). Videregående Sandsynlighedsregning (Advanced Probability Theory) (3rd ed.). HCØ-tryk, Copenhagen. pp. 18–20. ISBN 87-91180-71-6
- Ledoux, Michel; Talagrand, Michel (1991). Probability in Banach spaces. Berlin: Springer-Verlag. pp. xii+480. ISBN 3-540-52013-9. MR1102015
- Romano, Joseph P.; Siegel, Andrew F. (1985). Counterexamples in probability and statistics. Great Britain: Chapman & Hall. ISBN 0-412-98901-8. LCCN 構文エラー:「r」を認識できません。 QA27-構文エラー:「r」を認識できません。
- van der Vaart, Aad W.; Wellner, Jon A. (1996). Weak convergence and empirical processes. New York: Springer-Verlag. ISBN 0-387-94640-3. LCCN 構文エラー:「v」を認識できません。 QA27-構文エラー:「v」を認識できません。
- van der Vaart, Aad W. (1998). Asymptotic statistics. New York: Cambridge University Press. ISBN 978-0-521-49603-2. LCCN 構文エラー:「v」を認識できません。 QA27-構文エラー:「v」を認識できません。
- Williams, D. (1991). Probability with Martingales. Cambridge University Press. ISBN 0-521-40605-6
- Wong, E.; Hájek, B. (1985). Stochastic Processes in Engineering Systems. New York: Springer–Verlag
本項目は Creative Commons Attribution-ShareAlike 3.0 Unported License でライセンスされた Citizendium の項目 "Stochastic convergence" に由来する内容を含みます。GFDL の下ではライセンスされません。