コンテンツにスキップ

英文维基 | 中文维基 | 日文维基 | 草榴社区

利用者:本間親文/sandbox

DCDAN(Deep Convolutional GAN)は、2015年にA.Radfordらによって発表された敵対的生成ネットワークの一種であり、生成ネットワーク(generator)と識別ネットワーク(discriminator)の2つのネットワークに畳み込みニューラルネットワーク(CNN)を用いたモデルのことである。

概要

[編集]

DCGANにおける生成モデルは100次元の一様分布Zを入力とし、転置畳み込みによって徐々に画像空間へ投影していく仕組みである。また識別モデルは同じくプーリング層を使わずに畳み込みによってダウンサンプリングしていき、活性化関数にはReLUの代わりにLeaky LeLUを使用する。

プーリング層や全結合層を使わずにCNNによって学習を進めることで、通常のGANよりも鮮明な画像の生成が可能になった。

さらにDCGANによる生成は、その入力のベクトル空間的な性質が極めて良いことが明らかになり、値の近い入力同士なら似たような画像を生成し、二つの入力の間の値によって生成される画像は二つの画像の意味的な中間となる。これにより、入力を適切に調整することでより高次な特徴レベルの画像をコントロールすることができる。[1]

脚注

[編集]
  1. ^ AIとデータ ―データに基づく意思決定と社会イノベーション創出―. オーム社. (2018年) 

参考文献

[編集]
  • 原論文
  • Antonio Gulli, Sujit Pal (2018) 『直感DeepLearning』オライリー・ジャパン
  • 浅川 伸一 , 江間 有沙 , 工藤 郁子 , 巣籠 悠輔  , 瀬谷 啓介  , 松井 孝之 , 松尾 豊 著(2018)『ディープラーニングG検定公式テキスト』翔泳社