コンテンツにスキップ

英文维基 | 中文维基 | 日文维基 | 草榴社区

「ガボールフィルタ」の版間の差分

出典: フリー百科事典『ウィキペディア(Wikipedia)』
削除された内容 追加された内容
Tianruo (会話 | 投稿記録)
m 定義への追記、脚注節の追加を行いました。
Cewbot (会話 | 投稿記録)
m Bot作業依頼: sourceタグをsyntaxhighlightタグに置換 (Category:非推奨のsourceタグを使用しているページ) - log
119行目: 119行目:


*[[MATLAB]]
*[[MATLAB]]
<source lang="matlab">
<syntaxhighlight lang="matlab">
function gb=gabor_fn(sigma_x,sigma_y,theta,lambda,psi,gamma)
function gb=gabor_fn(sigma_x,sigma_y,theta,lambda,psi,gamma)


136行目: 136行目:


gb=exp(-.5*(x_theta.^2/sigma_x^2+gamma^2*y_theta.^2/sigma_y^2)).*cos(2*pi/lambda*x_theta+psi);
gb=exp(-.5*(x_theta.^2/sigma_x^2+gamma^2*y_theta.^2/sigma_y^2)).*cos(2*pi/lambda*x_theta+psi);
</syntaxhighlight>
</source>


== 脚注 ==
== 脚注 ==

2020年7月5日 (日) 22:58時点における版

2次元ガボールフィルタを漢字に作用させた例。左上から時計回りに原画像、搬送波の方向を45°づつ順に変えた4つのフィルタの作用結果、及びそれら4つのフィルタ結果を重ね合わせた図を表す。

ガボールフィルタ: Gabor filter)とは、画像処理のテクスチャー解析等に用いられる線型フィルタの一種。(2次元のガボールフィルタでは)画像の各点周りの局所領域において、方向毎に特定の周波数成分を抽出することができる。 虹彩認識指紋認証にも応用されている他、哺乳類の脳の一次視覚野にある単純型細胞の活動をモデル化できることが示されている。名称はガーボル・デーネシュに因む[1]


定義

2次元ガボールフィルタのインパルス応答の例

ガボールフィルタは、ガウス関数(ガウシアンエンベロープとも呼ばれる)と三角関数搬送波とも呼ばれる)を乗じたものとして定義される[2][3]

ここで はガウシアンエンベロープの強度のスケール、 はガウシアンエンベロープのスケールや方向を指定する線形変換、は搬送波の(空間)周波数と方向を表す波数ベクトル、 は位相オフセットを表す。 の具体的な形は、1次元の場合、通常スケールパラメータにより

,

,

2次元の場合は、ガウシアンエンベロープの方向と軸毎のスケールパラメータにより

,

と表す。ここでで、

である。として、実部と虚部に分けた形も用いられる:

,
,


応用

画像処理では通常、異なる周波数、検出方向のガボールフィルタで構成されるフィルタバンクの形でよく利用される(これを画像に作用させて得られる出力をガボール空間という)。具体的事例は以下:

  • スキャンした文書の中のテキスト部分の抽出(一般にテキスト部分が、画像部分に比べ相対的に高周波数成分が多いことを利用している)[4][5][6][7]
  • 顔の表情の認識[8]や髪型のモデリング[9]
  • 脊椎の骨梁(trabecular bone)における方向性の分布の分析[10]
  • シーンを記述する低次元の大域特徴[2][14]

ガボールフィルタはガボールウェーブレットと直接関係しており、ガボールフィルタに回転や膨張を加えることで設計されるが、拡大は非常に時間がかかるため、ガボールウェーブレットでは適用されない[要出典]

実装例

function gb=gabor_fn(sigma_x,sigma_y,theta,lambda,psi,gamma)

sz_x=fix(6*sigma_x);
if mod(sz_x,2)==0, sz_x=sz_x+1;end
	

sz_y=fix(6*sigma_y);
if mod(sz_y,2)==0, sz_y=sz_y+1;end

[x y]=meshgrid(-fix(sz_x/2):fix(sz_x/2),fix(-sz_y/2):fix(sz_y/2));

% Rotation 
x_theta=x*cos(theta)+y*sin(theta);
y_theta=-x*sin(theta)+y*cos(theta);

gb=exp(-.5*(x_theta.^2/sigma_x^2+gamma^2*y_theta.^2/sigma_y^2)).*cos(2*pi/lambda*x_theta+psi);

脚注

  1. ^ D. Gabor (1946). “Theory of communications”. J. IEE London 93: 429-457. 
  2. ^ a b 原田達也 (2017). 画像認識. 機械学習プロフェッショナルシリーズ. 講談社 
  3. ^ Movellan, Javier R.. “Tutorial on Gabor Filters”. 2008年5月14日閲覧。
  4. ^ Pati, Peeta Basa; Ramakrishnan, A.G. (July 2008). “Word level multi-script identification” (英語). Pattern Recognition Letters 29 (9): 1218–1229. doi:10.1016/j.patrec.2008.01.027. ISSN 0167-8655. 
  5. ^ Raju S, S.; Pati, P.B.; Ramakrishnan, A.G. (2004). “Gabor filter based block energy analysis for text extraction from digital document images”. First International Workshop on Document Image Analysis for Libraries, 2004. Proceedings. (Palo Alto, CA, USA: IEEE): 233–243. doi:10.1109/DIAL.2004.1263252. ISBN 978-0-7695-2088-9. LCCN 2003-116308. OL OL8067708M. http://eprints.iisc.ac.in/490/1/Gabor_Filter_Based_Block_Engery_Analy...pdf. 
  6. ^ Raju, S. Sabari; Pati, P. B.; Ramakrishnan, A. G. (2005). “Text Localization and Extraction from Complex Color Images”. Lecture Notes in Computer Science 3804: 486–493. doi:10.1007/11595755_59. ISBN 978-3-540-30750-1. ISSN 0302-9743. LCCN 2005-936803. OL OL9056158M. https://archive.org/details/advancesvisualco00bebi_320. 
  7. ^ S Sabari Raju, P B Pati and A G Ramakrishnan, “Text Localization and Extraction from Complex Color Images,” Proc. First International Conference on Advances in Visual Computing (ISVC05), Nevada, USA, LNCS 3804, Springer Verlag, Dec. 5-7, 2005, pp. 486-493.
  8. ^ Lyons, M.; Akamatsu, S.; Kamachi, M.; Gyoba, J. (1998). Coding facial expressions with Gabor wavelets. pp. 200–205. doi:10.1109/AFGR.1998.670949. ISBN 0-8186-8344-9. OL OL11390549M. https://zenodo.org/record/3430156 
  9. ^ Menglei Chai and Lvdi Wang and Yanlin Weng and Yizhou Yu and Baining Guo and Kun Zhou (2012). “Single-view hair modeling for portrait manipulation”. ACM Trans. Graph. 31 (116): 1-8. doi:10.1145/2185520.2185612. http://www.ncbi.nlm.nih.gov/pubmed/3437332. 
  10. ^ C.M.Gdyczynski, etal (2014). “On estimating the directionality distribution in pedicle trabecular bone from micro-CT images”. Journal of Physiological Measurements 35 (12): 2415–2428. Bibcode2014PhyM...35.2415G. doi:10.1088/0967-3334/35/12/2415. PMID 25391037. 
  11. ^ Jones JP, Palmer LA (Dec 1987). “An evaluation of the two-dimensional Gabor filter model of simple receptive fields in cat striate cortex”. J Neurophysiol 58 (6): 1233-1258. http://www.ncbi.nlm.nih.gov/pubmed/3437332. 
  12. ^ Marčelja, S. (1980). “Mathematical description of the responses of simple cortical cells”. Journal of the Optical Society of America 70 (11): 1297–1300. Bibcode1980JOSA...70.1297M. doi:10.1364/JOSA.70.001297. PMID 7463179. 
  13. ^ Daugman, John G. (1985-07-01). “Uncertainty relation for resolution in space, spatial frequency, and orientation optimized by two-dimensional visual cortical filters” (英語). Journal of the Optical Society of America A 2 (7): 1160–9. Bibcode1985JOSAA...2.1160D. doi:10.1364/JOSAA.2.001160. ISSN 1084-7529. PMID 4020513. 
  14. ^ Oliva, A., Torralba (2001). “Modeling the Shape of the Scene: A Holistic Representation of the Spatial Envelope”. International Journal of Computer Vision 42: 145-175. doi:10.1023/A:1011139631724. 

参考文献

関連項目

外部リンク