利用者:Diadochos/sandbox

ここはDiadochosさんの利用者サンドボックスです。編集を試したり下書きを置いておいたりするための場所であり、百科事典の記事ではありません。ただし、公開の場ですので、許諾されていない文章の転載はご遠慮ください。

登録利用者は自分用の利用者サンドボックスを作成できます（サンドボックスを作成する、解説）。

カーネル という語は、統計学において複数の異なる意味に用いられる。

ベイズ統計学

統計学、特にベイズ統計学において、ある確率密度関数または確率質量関数のカーネルとは、確率密度関数や確率質量関数の、ドメイン内のいかなる変数の関数でもないすべての因子が省略されるような形式である^[要出典]。そのような要因は、それらの確率密度関数や確率質量関数のパラメーターの関数であってもよい。これらの因子は、確率分布の正規化係数の一部をなし、またそれらは多くの場合不要である。

例えば、擬似乱数サンプリングでは、ほとんどのサンプリングアルゴリズムは正規化係数を無視する。さらに、共役事前確率分布のベイズ分析では、計算途中において正規化係数は一般に無視され、カーネルのみが考慮される。最終的に、カーネルの形式が調査され、もしそれが既知の分布に一致すれば、正規化係数は復元されることができる。そうでなければ、正規化係数は不要かもしれない（例えば、その分布はサンプリングに用いられるだけであれば不要である）。多くの分布において、カーネルは閉形式で書くことができるが、正規化定数はそうではない。

一つの例は、正規分布である。正規分布の確率密度関数は

p(x|\mu ,\sigma ^{2})={\frac {1}{\sqrt {2\pi \sigma ^{2}}}}e^{-{\frac {(x-\mu )^{2}}{2\sigma ^{2}}}}

であり、対応するカーネルは

p(x|\mu ,\sigma ^{2})\propto e^{-{\frac {(x-\mu )^{2}}{2\sigma ^{2}}}}

である。

指数関数の前にある因子は、 $\sigma ^{2}$ というパラメーターを含みながらも、省略されている。なぜならばそれは、定義域の変数 $x$ の関数ではないからである。

パターン分析

再生核ヒルベルト空間のカーネルが、カーネル法として知られる一連の手法において、implicit spaceのデータに対し、クラス識別、回帰分析、クラスター分析などを実行するのに用いられる。この用法は特に機械学習においてよく用いられる。

ノンパラメトリック統計

ノンパラメトリック手法において、カーネルとは、ノンパラメトリックな推定手法に用いられる重み付け関数のことである。カーネルは、確率変数の確率密度関数を推定するためのカーネル密度推定や、確率変数の条件付き期待値を推定するカーネル回帰に用いられる。カーネルは時系列分析においては窓関数という名称で、ピリオドグラムによってスペクトル密度を推定するのに用いられる。その他の利用法としては、点過程の時間可変な強度の推定にも用いられる。そこでは窓関数(カーネル)は、時系列データとともに畳み込まれる。

ノンパラメトリックな推定を実行する際はふつう、(カーネル関数に加えて)カーネルの幅も指定されなければならない。

定義

→詳細は「積分変換」を参照

カーネルとは、非負実数値可積分関数 K であって、次の2つの条件を満たすもののことである。

$\int _{-\infty }^{+\infty }K(u)\,du=1\,;$
$K(-u)=K(u){\mbox{ for all values of }}u\,.$

一つめの要件は、カーネル密度推定の結果が確率密度関数となることを担保するものである。

二つめの要件は、対応する分布の平均が、利用されたサンプルの平均に等しくなることを担保するものである。

もし K がカーネルであれば、λ > 0 に対して K*(u) = λK(λu) で定義される K* もカーネルとなる。この性質は、データに適したスケールを選択するために用いることができる。

よく用いられるカーネル関数

いくつかの種類のカーネル関数がよく用いられる。たとえば一様、三角、Epanechnikov,^[1] quartic (biweight), tricube,^[2] triweight, ガウシアン、quadratic^[3]、コサインである。

下の表において、1_{…} は指示関数である。

カーネル関数, K(u)		$\textstyle \int u^{2}K(u)du$	$\textstyle \int K(u)^{2}du$	Efficiency* relative to the Epanechnikov kernel
一様	$K(u)={\frac {1}{2}}\,\mathbf {1} _{\{\|u\|\leq 1\}}$	${\frac {1}{3}}$	${\frac {1}{2}}$	1.076
三角	$K(u)=(1-\|u\|)\,\mathbf {1} _{\{\|u\|\leq 1\}}$	${\frac {1}{6}}$	${\frac {2}{3}}$	1.014
Epanechnikov	$K(u)={\frac {3}{4}}(1-u^{2})\,\mathbf {1} _{\{\|u\|\leq 1\}}$	${\frac {1}{5}}$	${\frac {3}{5}}$	1.000
Quartic (biweight)	$K(u)={\frac {15}{16}}(1-u^{2})^{2}\,\mathbf {1} _{\{\|u\|\leq 1\}}$	${\frac {1}{7}}$	${\frac {5}{7}}$	1.006
Triweight	$K(u)={\frac {35}{32}}(1-u^{2})^{3}\,\mathbf {1} _{\{\|u\|\leq 1\}}$	${\frac {1}{9}}$	${\frac {350}{429}}$	1.013
Tricube	$K(u)={\frac {70}{81}}(1-{\left\|u\right\|}^{3})^{3}\,\mathbf {1} _{\{\|u\|\leq 1\}}$	${\frac {35}{243}}$	${\frac {175}{247}}$	1.002
ガウシアン	$K(u)={\frac {1}{\sqrt {2\pi }}}e^{-{\frac {1}{2}}u^{2}}$	$1\,$	${\frac {1}{2{\sqrt {\pi }}}}$	1.051
コサイン	$K(u)={\frac {\pi }{4}}\cos \left({\frac {\pi }{2}}u\right)\mathbf {1} _{\{\|u\|\leq 1\}}$	$1-{\frac {8}{\pi ^{2}}}$	${\frac {\pi ^{2}}{16}}$	1.0005
ロジスティック	$K(u)={\frac {1}{e^{u}+2+e^{-u}}}$	${\frac {\pi ^{2}}{3}}$	${\frac {1}{6}}$	1.127
Silverman カーネル^[4]	$K(u)={\frac {1}{2}}e^{-{\frac {\|u\|}{\sqrt {2}}}}\cdot \sin \left({\frac {\|u\|}{\sqrt {2}}}+{\frac {\pi }{4}}\right)$	$0$	${\frac {3{\sqrt {2}}}{16}}$	適用できない

効率性は $\left(\int u^{2}K(u)du\right)^{\frac {1}{2}}\cdot \int K(u)^{2}du$ によって定義される。

上述したカーネルの一部を、同一の座標に表示した図

参考文献

^ Named for Epanechnikov, V. A. (1969). “Non-Parametric Estimation of a Multivariate Probability Density”. Theory Probab. Appl. 14 (1): 153–158. doi:10.1137/1114019.
^ Altman, N. S. (1992). “An introduction to kernel and nearest neighbor nonparametric regression”. The American Statistician 46 (3): 175–185. doi:10.1080/00031305.1992.10475879.
^ Cleveland, W. S. & Devlin, S. J. (1988). “Locally weighted regression: An approach to regression analysis by local fitting”. Journal of the American Statistical Association 83: 596–610. doi:10.1080/01621459.1988.10478639.
^ Silverman, B. W. (1986). Density Estimation for Statistics and Data Analysis. Chapman and Hall, London

Li, Qi; Racine, Jeffrey S. (2007). Nonparametric Econometrics: Theory and Practice. Princeton University Press. ISBN 0-691-12161-3

Zucchini, Walter. “APPLIED SMOOTHING TECHNIQUES Part 1: Kernel Density Estimation”. 12 August 2015閲覧。

Comaniciu, D; Meer, P (2002). “Mean shift: A robust approach toward feature space analysis”. IEEE Transactions on Pattern Analysis and Machine Intelligence 24 (5): 603–619. doi:10.1109/34.1000236. CiteSeer^x: 10.1.1.76.8968.

[1] Named for Epanechnikov, V. A. (1969). “Non-Parametric Estimation of a Multivariate Probability Density”. Theory Probab. Appl. 14 (1): 153–158. doi:10.1137/1114019.

[2] Altman, N. S. (1992). “An introduction to kernel and nearest neighbor nonparametric regression”. The American Statistician 46 (3): 175–185. doi:10.1080/00031305.1992.10475879.

[3] Cleveland, W. S. & Devlin, S. J. (1988). “Locally weighted regression: An approach to regression analysis by local fitting”. Journal of the American Statistical Association 83: 596–610. doi:10.1080/01621459.1988.10478639.

[4] Silverman, B. W. (1986). Density Estimation for Statistics and Data Analysis. Chapman and Hall, London

[1]

[2]

[3]

[4]