「AlphaGo」の版間の差分
74行目: | 74行目: | ||
2017年4月10日、開発者デミス・ハサビスは、同年5月23日から27日にかけて囲碁の発祥地中国の[[浙江省]][[烏鎮]]インターネット国際会展センター({{仮リンク|世界インターネット大会|en|World Internet Conference}}の永久開催地)にてGoogleと[[中国囲棋協会]]と中国政府が共催する{{仮リンク|フューチャー・オブ・ゴ・サミット|en|Future of Go Summit}}で「世界最強の棋士」柯潔とAlphaGoは対戦を行うと発表した<ref name="denis20170523">{{Cite web|url=https://japan.googleblog.com/2017/04/future-of-go-summit.html|title=囲碁の神秘を求めて ーー Future of Go Summit 開催|accessdate=2017-05-23|author=|date=2017-04-10|publisher=[[Google]]}}</ref>。また、同大会でAlphaGoの新たな可能性を探究するとしてこれまでになかったチーム対局やペア対局も行われるとした<ref name="denis20170523"/>。 |
2017年4月10日、開発者デミス・ハサビスは、同年5月23日から27日にかけて囲碁の発祥地中国の[[浙江省]][[烏鎮]]インターネット国際会展センター({{仮リンク|世界インターネット大会|en|World Internet Conference}}の永久開催地)にてGoogleと[[中国囲棋協会]]と中国政府が共催する{{仮リンク|フューチャー・オブ・ゴ・サミット|en|Future of Go Summit}}で「世界最強の棋士」柯潔とAlphaGoは対戦を行うと発表した<ref name="denis20170523">{{Cite web|url=https://japan.googleblog.com/2017/04/future-of-go-summit.html|title=囲碁の神秘を求めて ーー Future of Go Summit 開催|accessdate=2017-05-23|author=|date=2017-04-10|publisher=[[Google]]}}</ref>。また、同大会でAlphaGoの新たな可能性を探究するとしてこれまでになかったチーム対局やペア対局も行われるとした<ref name="denis20170523"/>。 |
||
第1局はAlphaGoが柯潔に半目勝ちし、柯潔は「人間では想像もつかない手を打ち、強かった」と述べた<ref>{{Cite web|url=https://mainichi.jp/articles/20170524/ddn/041/040/030000c|title=米アルファ碁「世界最強」降す 柯九段「強くなった」|accessdate=2017-05-24|author=|date=2017-05-24|publisher=[[毎日新聞]]}}</ref><ref>{{Cite web|url=http://jp.reuters.com/article/alphago-idJPKBN18K0BQ|title=米グーグルのAI、世界最強の中国囲碁棋士に第1局で勝利|accessdate=2017-05-24|author=|date=2017-05-24|publisher=[[ロイター]]}}</ref>。第2局もAlphaGoの勝ちとなり、シリーズの勝ち越しが決定。デミス・ハサビスは柯潔を「100手までは今までの人間との対局で最も接戦だった」とその健闘を称えた<ref>{{Cite web|url=http://www.sankei.com/life/news/170526/lif1705260063-n1.html|title=囲碁AIが世界最強棋士に連勝 開発会社CEOは柯九段の健闘たたえる|accessdate=2017-05-26|author=|date=2017-05-26|publisher=[[産経ニュース]]}}</ref>。チーム対局も[[時越]]、[[羋昱廷]]、[[唐韋星]]、[[ |
第1局はAlphaGoが柯潔に半目勝ちし、柯潔は「人間では想像もつかない手を打ち、強かった」と述べた<ref>{{Cite web|url=https://mainichi.jp/articles/20170524/ddn/041/040/030000c|title=米アルファ碁「世界最強」降す 柯九段「強くなった」|accessdate=2017-05-24|author=|date=2017-05-24|publisher=[[毎日新聞]]}}</ref><ref>{{Cite web|url=http://jp.reuters.com/article/alphago-idJPKBN18K0BQ|title=米グーグルのAI、世界最強の中国囲碁棋士に第1局で勝利|accessdate=2017-05-24|author=|date=2017-05-24|publisher=[[ロイター]]}}</ref>。第2局もAlphaGoの勝ちとなり、シリーズの勝ち越しが決定。デミス・ハサビスは柯潔を「100手までは今までの人間との対局で最も接戦だった」とその健闘を称えた<ref>{{Cite web|url=http://www.sankei.com/life/news/170526/lif1705260063-n1.html|title=囲碁AIが世界最強棋士に連勝 開発会社CEOは柯九段の健闘たたえる|accessdate=2017-05-26|author=|date=2017-05-26|publisher=[[産経ニュース]]}}</ref>。チーム対局も[[時越]]、[[羋昱廷]]、[[唐韋星]]、[[陳耀燁]]、[[周睿羊]]といった世界戦優勝経験者5人の集団相手にAlphaGoは勝利した<ref>{{Cite web|url=http://www.sankei.com/world/news/170526/wor1705260054-n1.html|title=トップ棋士5人でも敗北 アルファ碁実力示す、中国|accessdate=2017-05-26|author=|date=2017-05-26|publisher=[[産経ニュース]]}}</ref>。ペア対局ではAlphaGoとタッグを組んで[[古力]]に勝った[[連笑]]は「とにかく楽しい。試合中、本当に最高の気分だった」と感想をもらした<ref>{{Cite web|url=http://wired.jp/2017/05/27/future-of-go-summit-day4/|title=「AlphaGoは楽しい」対局中のプロ棋士5人の笑顔が物語るもの:現地レポート|accessdate=2017-05-27|author=|date=2017-05-27|publisher=[[WIRED (雑誌)|WIRED]]}}</ref>。第3局もAlphaGoは柯潔に勝ち3局全勝となった。柯潔は負けが確定したときに席を外し、戻った際に涙を拭いた<ref>{{Cite web|url=http://wired.jp/2017/05/28/future-of-go-summit-day5/|title=「AlphaGo」という“神”の引退と、人類最強の19歳が見せた涙の意味:現地レポート|accessdate=2017-05-29|author=|date=2017-05-28|publisher=[[WIRED (雑誌)|WIRED]]}}</ref>。デミス・ハサビスは「人間との対局はこれを最後とする」と発表した<ref>{{Cite web|url=http://www.yomiuri.co.jp/culture/20170527-OYT1T50100.html|title=AIアルファ碁3連勝「人間との対局は終える」|accessdate=2017-05-27|author=|date=2017-05-26|publisher=[[読売新聞]]}}</ref>。2018年現在、AlphaGoがプロ棋士と対局したのはこの柯潔との対局が最後となっている。 |
||
中国政府の[[検閲]]をめぐって検索サービスを撤退させたGoogleにとって中国市場再進出を企図<ref>{{Cite web|url=http://jp.wsj.com/articles/SB10916868980930144459004583174580311997520|title=「アルファ碁」足掛かりに中国再参入を目指すグーグル|website=[[WSJ]]|accessdate=2017-05-29}}</ref>して2010年以来の中国政府と協力したイベントだったものの<ref>{{Cite web|url=https://www.ft.com/content/b59dff10-3f7e-11e7-9d56-25f963e998b2|title=Google deploys AI for Go tournament in China charm offensive AlphaGo |website=Financial Times|accessdate=2017-05-27}}</ref>、中国メディアは予定されていた中継を中止してAlphaGoと柯潔の対局を報じた際には海外向け<ref>{{cite web|url=http://en.people.cn/n3/2017/0523/c90000-9219327.html|title=Chinese Go master Ke Jie loses to Google's AlphaGo in first of three-game match - People's Daily Online|first=|last=|website=[[人民網]]|accessdate=2017-05-27}}</ref>を除いてGoogleのことに触れなかった<ref>{{Cite web|url=http://www.sankei.com/world/news/170523/wor1705230075-n1.html|title=中国、アルファ碁との対局中継取り消し グーグルとの確執関係か|accessdate=2017-05-23|author=|date=2017-05-24|publisher=[[産経ニュース]]}}</ref>。一方で中国固有の文化たる囲碁への影響を中国政府は考慮したとの見方もある<ref>{{Cite web|url=https://www.nytimes.com/2017/05/23/business/google-deepmind-alphago-go-champion-defeat.html?_r=0|title=Google’s AlphaGo Defeats Chinese Go Master in Win for A.I.|accessdate=2017-05-23|author=|date=2017-05-24|publisher=[[ニューヨーク・タイムズ]]}}</ref>。なお、後の2017年12月13日にGoogleは[[アジア]]初の人工知能研究センターを中国の[[北京]]に開設すると発表し<ref>{{Cite web|date=2017-12-14|url=https://japan.cnet.com/article/35111950/|title=グーグル、中国にAI研究センターを開設--「この種の研究施設はアジア初」|publisher=[[CNET]]|accessdate=2017-12-15}}</ref>、AlphaGoと柯潔の対戦も影響したとされる<ref>{{Cite web|date=2017-12-13|url=http://english.sina.com/buz/s/2017-12-13/detail-ifypsvkp2530961.shtml|title=Google launching artificial intelligence research center in China|publisher=[[新浪]]|accessdate=2017-12-15}}</ref>。 |
中国政府の[[検閲]]をめぐって検索サービスを撤退させたGoogleにとって中国市場再進出を企図<ref>{{Cite web|url=http://jp.wsj.com/articles/SB10916868980930144459004583174580311997520|title=「アルファ碁」足掛かりに中国再参入を目指すグーグル|website=[[WSJ]]|accessdate=2017-05-29}}</ref>して2010年以来の中国政府と協力したイベントだったものの<ref>{{Cite web|url=https://www.ft.com/content/b59dff10-3f7e-11e7-9d56-25f963e998b2|title=Google deploys AI for Go tournament in China charm offensive AlphaGo |website=Financial Times|accessdate=2017-05-27}}</ref>、中国メディアは予定されていた中継を中止してAlphaGoと柯潔の対局を報じた際には海外向け<ref>{{cite web|url=http://en.people.cn/n3/2017/0523/c90000-9219327.html|title=Chinese Go master Ke Jie loses to Google's AlphaGo in first of three-game match - People's Daily Online|first=|last=|website=[[人民網]]|accessdate=2017-05-27}}</ref>を除いてGoogleのことに触れなかった<ref>{{Cite web|url=http://www.sankei.com/world/news/170523/wor1705230075-n1.html|title=中国、アルファ碁との対局中継取り消し グーグルとの確執関係か|accessdate=2017-05-23|author=|date=2017-05-24|publisher=[[産経ニュース]]}}</ref>。一方で中国固有の文化たる囲碁への影響を中国政府は考慮したとの見方もある<ref>{{Cite web|url=https://www.nytimes.com/2017/05/23/business/google-deepmind-alphago-go-champion-defeat.html?_r=0|title=Google’s AlphaGo Defeats Chinese Go Master in Win for A.I.|accessdate=2017-05-23|author=|date=2017-05-24|publisher=[[ニューヨーク・タイムズ]]}}</ref>。なお、後の2017年12月13日にGoogleは[[アジア]]初の人工知能研究センターを中国の[[北京]]に開設すると発表し<ref>{{Cite web|date=2017-12-14|url=https://japan.cnet.com/article/35111950/|title=グーグル、中国にAI研究センターを開設--「この種の研究施設はアジア初」|publisher=[[CNET]]|accessdate=2017-12-15}}</ref>、AlphaGoと柯潔の対戦も影響したとされる<ref>{{Cite web|date=2017-12-13|url=http://english.sina.com/buz/s/2017-12-13/detail-ifypsvkp2530961.shtml|title=Google launching artificial intelligence research center in China|publisher=[[新浪]]|accessdate=2017-12-15}}</ref>。 |
2020年8月27日 (木) 22:41時点における版
囲碁 |
---|
AlphaGo(アルファ碁、アルファご)は、Google DeepMindによって開発されたコンピュータ囲碁プログラムである。 2015年10月に、人間のプロ囲碁棋士を互先(ハンディキャップなし)で破った初のコンピュータ囲碁プログラムとなった[1][2]。 2016年3月15日には、李世乭との五番勝負で3勝(最終的に4勝1敗)を挙げ、韓国棋院に(プロとしての)名誉九段を授与された。[3]。 また、2017年5月には、柯潔との三番勝負で3局全勝を挙げ、中国囲棋協会にプロの名誉九段を授与された[4]。Google DeepMindは世界トップ棋士である柯潔に勝利したことを機に、AlphaGoを人間との対局から引退させると発表した[5][6]。
コンピュータが人間に打ち勝つことが最も難しいと考えられてきた分野である囲碁において、人工知能が勝利を収めたことは世界に衝撃をもたらした。AlphaGoの登場は単なる一競技の勝敗を越え、人工知能の有用性を広く知らしめるものとなり、世界的AIブームを呼び起こすきっかけともなった。
概要
囲碁は創造的、戦略的思考を必要とする複雑なボードゲームであり[7]、長い間、囲碁は、チェスのようなその他のゲームと比較して人間に勝つのがコンピュータにとってはるかに困難であると考えられていた。これは、他のボードゲームよりも可能な局面の数がはるかに大きい(約2×10172通り[8])ため、力まかせ探索といった伝統的なAI手法にとって極めて困難なためであった[1]。
2015年より前は[9]、最良の囲碁プログラムはアマチュアの有段レベルに達するのがやっとであった[10]。小さな9路盤(9×9)ではコンピュータは健闘し、一部のプログラムはプロ棋士に対して9路盤で互角に戦うだけの力があったが、19路盤ではプロ棋士に太刀打ちできていなかった[11]。IBMのコンピュータディープ・ブルーがチェス世界チャンピオンガルリ・カスパロフを1997年に破った後、囲碁が人間のアマチュアの強さに達するまでにほぼ20年を要した[12][2][1]。人工知能の分野における多くの人々も、囲碁はチェスよりも人間の思考を模倣するためにより多くの要素を必要とすると考えていた[13]。
AlphaGoはそれ以前のAIの取り組みとはニューラルネットワークを応用している点において最も大きく異なっている。ニューラルネットワークでは、評価経験則が人間によってハードコードされておらず、代わりにプログラム自身によって自分自身との対局を数千万回繰り返すことによってかなりの程度まで学ぶ。AlphaGoの開発チームでさえ、AlphaGoがどのように石の配置を評価し次の手を選択しているかを指摘することはできない。モンテカルロ木探索もプログラムの推論効率を改善するための主要な方法として用いられている。
AlphaGoは、それ以前の囲碁プログラムから著しい発展を遂げた。その他の利用可能な囲碁プログラムと対局した500局で、AlphaGoは1局しか負けなかった[14]。
2015年10月、ヨーロッパチャンピオンに勝利。さらに2016年3月には世界戦で18回優勝の経験のあるトップ棋士・李世乭九段(韓国)に4勝1敗と勝ち越す。そして2017年5月にはレーティングで当時世界トップ棋士だった中国の柯潔九段に3連勝を果たし、人類との対局から引退した。
2017年10月18日、過去の試合データを使わず、ビッグデータ不要で自己対局のみでスキルアップする新囲碁AI「AlphaGo Zero」を発表した[15][16]。生まれてから40日後には、5月に世界最強棋士、柯潔九段を破った「AlphaGo Master」に完勝した[17]。
2017年12月5日、AlphaGo Zeroのアプローチを汎化させ、囲碁以外のゲームにも対応できるようになったAlphaZeroを発表した。AlphaZeroは5000台のTPUを使用し、AlphaGo Zeroを8時間の学習で上回った[18]。
人間との対局
樊麾との対局
AlphaGoは2015年10月に、ヨーロッパ王者の樊麾を5-0で破った。AIがプロレベルの人間にハンディキャップなしの19路盤で破ったのはこれが初めてであった[19][20]。一部の解説者は樊麾と李世乭(プロ九段)との間の実力の差を強調した[21]。コンピュータプログラムのZenとCrazy Stoneはこれ以前に九段のプロ棋士を4子のハンディキャップ付きで破っていた[22][23]。カナダのAI専門家ジョナサン・シェーファーは、樊との対局後にAlphaGoを未熟な「神童」と論評し、「プログラム(AlphaGo)が真にトップの棋士と対局した時が本物の成果となるだろう」と考えた。シェーファーは、2016年3月の対局では李が勝利するだろうと考えた[20]。プロ棋士で国際囲碁連盟事務局長の李夏辰は、AIが李に挑戦する見通しに「非常に興奮している」と意見を述べ、両者に等しく勝利する機会があると考えた[20]。
囲碁の専門家は樊に対するAlphaGoの打ち方について、大局観に欠ける点などのミスを指摘したが、樊との対局から李との対局の間にどの程度プログラムが改善されるかは未知であった[24][25]。Google DeepMindのデイヴィッド・シルバーは、AlphaGoは李の以前の棋譜を使って特別に鍛えられてはいないと述べた[26]。
プログラムに用いられたアルゴリズム[2]について記述したNature誌に掲載される論文の発表と合わせるために、このニュースの発表は2016年1月27日まで遅れた[27]。
李世乭との対局
AlphaGoは、2016年3月に数多くの世界戦優勝経験のあるプロ棋士李世乭(九段)に挑戦した[28]。結果は、4勝1敗と勝ち越した[28]。
- 第1局の盤面。白がAlphaGo。
新バージョンMaster
2017年初頭、ネットの囲碁対戦サイトに「Master」を名乗る打ち手が出現、日中韓のトップ棋士を相手に60戦無敗という驚異的な戦績を挙げて話題を集めた。1月5日になり、開発者デミス・ハサビスはツイッターにて、MasterはAlphaGoの新バージョンであることを明かした[29]。これらの対戦は非公式なテストであり、2017年内に本格的な公式戦を行なう方針としている。
柯潔との対局
2016年3月、AlphaGo対李世ドル第一局の終局後、李世乭とは通算9勝2敗の世界棋士レート1位[30][31]の柯潔は「AlphaGoは李世乭に勝っても、私には勝てない」と豪語した[32]。
国際囲碁連盟事務局長で国家体育総局棋牌運動管理センターの中国共産党委員会書記である楊俊安は近いうちにAlphaGoと柯潔は「人間と機械の最終決戦」として対局を行うと発表した[33]。
2017年4月10日、開発者デミス・ハサビスは、同年5月23日から27日にかけて囲碁の発祥地中国の浙江省烏鎮インターネット国際会展センター(世界インターネット大会の永久開催地)にてGoogleと中国囲棋協会と中国政府が共催するフューチャー・オブ・ゴ・サミットで「世界最強の棋士」柯潔とAlphaGoは対戦を行うと発表した[34]。また、同大会でAlphaGoの新たな可能性を探究するとしてこれまでになかったチーム対局やペア対局も行われるとした[34]。
第1局はAlphaGoが柯潔に半目勝ちし、柯潔は「人間では想像もつかない手を打ち、強かった」と述べた[35][36]。第2局もAlphaGoの勝ちとなり、シリーズの勝ち越しが決定。デミス・ハサビスは柯潔を「100手までは今までの人間との対局で最も接戦だった」とその健闘を称えた[37]。チーム対局も時越、羋昱廷、唐韋星、陳耀燁、周睿羊といった世界戦優勝経験者5人の集団相手にAlphaGoは勝利した[38]。ペア対局ではAlphaGoとタッグを組んで古力に勝った連笑は「とにかく楽しい。試合中、本当に最高の気分だった」と感想をもらした[39]。第3局もAlphaGoは柯潔に勝ち3局全勝となった。柯潔は負けが確定したときに席を外し、戻った際に涙を拭いた[40]。デミス・ハサビスは「人間との対局はこれを最後とする」と発表した[41]。2018年現在、AlphaGoがプロ棋士と対局したのはこの柯潔との対局が最後となっている。
中国政府の検閲をめぐって検索サービスを撤退させたGoogleにとって中国市場再進出を企図[42]して2010年以来の中国政府と協力したイベントだったものの[43]、中国メディアは予定されていた中継を中止してAlphaGoと柯潔の対局を報じた際には海外向け[44]を除いてGoogleのことに触れなかった[45]。一方で中国固有の文化たる囲碁への影響を中国政府は考慮したとの見方もある[46]。なお、後の2017年12月13日にGoogleはアジア初の人工知能研究センターを中国の北京に開設すると発表し[47]、AlphaGoと柯潔の対戦も影響したとされる[48]。
バージョン
AlphaGo Fan
- 初代バージョン。GPU176台を使用。
- 2015年10月、コンピュータ囲碁として初めてプロ棋士(樊麾)に互先での勝利を収めた(5戦5勝)。
AlphaGo Lee
AlphaGo Master
- 3代目バージョン。TPU4台を使用。
- 2016年暮れから2017年初頭にかけて、ネット碁でプロ棋士相手に60連勝を達成した。その後同年5月、人類最強の棋士である柯潔に3戦全勝した。
AlphaGo Zero
- 4代目バージョン。TPU4台を使用。
- 2017年10月に発表された。従来のバージョンとは大きく異なり、棋譜やビッグデータを必要とせず自己対局によって強化される[49][50][51]。全くの初心者の状態から3日間の学習でAlphago Leeのレベルに到達し、21日目にAlphago Masterと肩を並べる。40日間の学習後、AlphaGo Leeには100戦全勝、AlphaGo Masterには100戦して89勝11敗と過去のバージョンを圧倒するレベルとなった。
AlphaZero
- 5代目バージョン。TPU5000台を使用。
- 2017年12月に発表された。AlphaGo Zeroのアプローチを汎用化させ、2時間で将棋、4時間でチェスの最高峰のAIに勝利し、AlphaGo Zeroも8時間で上回った[52]。
新手法
AlphaGoは、これまで常識にない手を数々打ち出している。また、小目からの二間ジマリなど、これまで特殊な手段とされてきた手を多用するなどして、世界の囲碁界に大きな衝撃を与えた。打ち出した手法のいくつかは、各国のプロ棋士によって模倣されて流行の布石・定石となっており、囲碁の考え方に変革を起こしている。
肩ツキ
AlphaGoを始めとしたモンテカルロ法を基礎とするプログラムは、肩ツキ(相手の石の斜め上に打つ手)を多用することが知られていた[53]。たとえばAlphaGoは李世ドル戦の第2局37手目において、第4線の石への肩ツキを披露し、世界を驚かせた。下図は、Master対張紫良(中国)で、AlphaGoが見せた肩ツキ2連発である(白1,7)。
ダイレクト三々
星への三々侵入は、これまでにも数多く打たれてきたが、相手に強い厚みを与えるため、周囲の状況を見極めながら打つべき手とされてきた。しかしAlphaGoは、極めて早い段階から三々への打ち込みを見せることが多く、この手法は「ダイレクト三々」と称されるようになった。ここから多くの定石が生まれ、人間のプロ棋士の間でも多用される手法となっている。下の図は、AlphaGoの自己対戦で現れた、序盤6手目及び13手目での三々入りである。
開発チーム
AlphaGo Fan
AlphaGo(AlphaGo Fan)について書かれた原著論文「Mastering the Game of Go with Deep Neural Networks and Tree Search」には以下の20名が著者として名を連ねている。コレスポンディング・オーサー(連絡著者)は筆頭著者のデイビッド・シルバーと最終著者のデミス・ハサビスであるが、論文冒頭に、シルバーと黄2名の貢献度が等価である旨が特記されている。Google本社に所属する2名を除く特記無き全員がGoogle DeepMind社の所属である[54]。
- デイビッド・シルバー / David Silver
- 黄士傑 / Aja Huang
- クリス・J・マディソン / Chris J. Maddison
- アーサー・ゲズ / Arthur Guez
- ローレン・シフレ / Laurent Sifre
- ジョージ・ヴァン・デン・ドリエッシェ / George van den Driessche
- ユリアン・シュリットヴィーザー / Julian Schrittwieser
- イオアニス・アントノグロウ / Ioannis Antonoglou
- ヴェーダ・パンニールセルヴァム / Veda Panneershelvam
- マルク・ランクトー / Marc Lanctot
- サンデル・ディーレマン / Sander Dieleman
- ドミニク・グレーヴェ / Dominik Grewe
- ジョン・ニャム / John Nham (Google)
- ナル・カルヒブレンナー / Nal Kalchbrenner
- イリヤ・サツケヴァー / Ilya Sutskever (Google)
- ティモシー・リリクラップ / Timothy Lillicrap
- マデリーン・リーチ / Madeleine Leach
- コーライ・カヴァキュオグル / Koray Kavukcuoglu
- ソーレ・グリーペル / Thore Graepel
- デミス・ハサビス / Demis Hassabis
Alphago Zero
Alphago Zeroについて書かれた論文「Mastering the game of Go without human knowledge」の著者は以下のメンバーである。AlphaGoと対局したプロ棋士の樊麾も名を連ねている。この論文では、著者のうち冒頭3名の貢献度が等価であると記されている。
- デイビッド・シルバー / David Silver
- ユリアン・シュリットヴィーザー / Julian Schrittwieser
- カレン・シモニャン / Karen Simonyan
- イオアニス・アントノグロウ / Ioannis Antonoglou
- 黄士傑 / Aja Huang
- アーサー・ゲズ / Arthur Guez
- トマ・ユベール / Thomas Hubert
- ルーカス・ベイカー / Lucas Baker
- マシュー・ライ / Matthew Lai
- エイドリアン・ボルトン / Adrian Bolton
- 陳御天 / Yutian Chen
- ティモシー・リリクラップ / Timothy Lillicrap
- 樊麾 / Fan Hui
- ローレン・シフレ / Laurent Sifre
- ジョージ・ヴァン・デン・ドリエッシェ / George van den Driessche
- ソーレ・グリーペル / Thore Graepel
- デミス・ハサビス / Demis Hassabis
AlphaZero
AlphaGo Zeroのアルゴリズムをチェスと将棋にも応用したAlphaZeroについて書かれた論文「A general reinforcement learning algorithm that masters chess, shogi, and Go through self-play」の著者は以下のメンバーである。この論文では、著者のうち冒頭3名の貢献度が等価であると記されている。
- デイビッド・シルバー / David Silver
- トマ・ユベール / Thomas Hubert
- ユリアン・シュリットヴィーザー / Julian Schrittwieser
- イオアニス・アントノグロウ / Ioannis Antonoglou
- マシュー・ライ / Matthew Lai
- アーサー・ゲズ / Arthur Guez
- マルク・ランクトー / Marc Lanctot
- ローレン・シフレ / Laurent Sifre
- ダルシャン・クマラン / Dharshan Kumaran
- ソーレ・グリーペル / Thore Graepel
- ティモシー・リリクラップ / Timothy Lillicrap
- カレン・シモニャン / Karen Simonyan
- デミス・ハサビス / Demis Hassabis
アルゴリズム
AlphaGo Master までは、ディープニューラルネットワークを用いて実装された「value network」と「policy network」によって動くモンテカルロ木探索を用いていた[1]。しかし、AlphaGo Zero では、ニューラルネットワークは一つに統合された。
AlphaGoは当初、棋譜に記録された熟練した棋士の手と合致するよう試みることによって、人間のプレーヤーを模倣するように訓練された。ある程度の能力に達すると、強化学習を用いて自分自身と多数の対戦を行ってさらに訓練された[1]。しかし、AlphaGo Zero では、ルール以外の知識は全く与えずに強化学習をして、40日という短時間で AlphaGo Master に100戦して89勝するまでになった。
ハードウェア
配置 | スレッド検索数 | CPU数 | GPU数 | イロレーティング |
---|---|---|---|---|
単独 | 40 | 48 | 1 | 2,151 |
単独 | 40 | 48 | 2 | 2,738 |
単独 | 40 | 48 | 4 | 2,850 |
単独 | 40 | 48 | 8 | 2,890 |
分散処理 | 12 | 428 | 64 | 2,937 |
分散処理 | 24 | 764 | 112 | 3,079 |
分散処理 | 40 | 1,202 | 176 | 3,140 |
分散処理 | 64 | 1,920 | 280 | 3,168 |
Google Cloud Platformのコンピュータ資源(CPU1202個、GPU176基)を使って学習させている。また、TensorFlowに対応したディープラーニング専用プロセッサ「Tensor Processing Unit (TPU)」をも使用している。
戦績
- vs樊麾 5勝0敗(非公開対局)
日付 | 結果 | 先番 | 相手 |
---|---|---|---|
2016.3.9 | 中押し勝ち | 李世乭 | |
2016.3.10 | 中押し勝ち | △ | |
2016.3.12 | 中押し勝ち | ||
2016.3.13 | 中押し負け | △ | |
2016.3.15 | 中押し勝ち | ||
2017.5.23 | 一目半勝ち | 柯潔 | |
2017.5.25 | 中押し勝ち | ||
2017.5.27 | 中押し勝ち |
※AlphaGoから見た結果
影響
囲碁は以前は当時のテクノロジーでは力の及ばない機械学習における難問であると見なされていたため、AlphaGoは人工知能研究における画期的な進展として歓迎されている[55][56]。コンピュータ囲碁研究の結果は、認知科学、パターン認識、機械学習といったその他の同様の分野に応用されている[57]。
囲碁が盛んな韓国ではAlphaGoが人間を超え韓国・中国・日本のプロに60連勝するほどの強さになっていることから、囲碁人気が低下していると朝鮮日報に報じられた。「アルファ碁が(プロ棋士に)60連勝してからは、テレビで囲碁の対局は見なくなった」「好手、悪手についてのプロ棋士の解説は信じられない」「人間が何千年もかけて築いてきた囲碁の定石が崩壊した」といった反応があった[58]。
天頂の囲碁(Zen)の開発者である尾島陽児は、「人間は人工知能に勝てなくなりますか?」という質問に「アルファ碁(AlphaGo)にはすでに勝てないと思います」と答えており、既にトッププロを凌駕しているという見解を示している。ただし、「対コンピュータの攻略法はあります。ネットで打っている人たちはコンピュータの対応に慣れていて、混乱させる手をたくさん打ってきます。コンピュータは複雑な読みが苦手なので、難しい読みが必要な形をあちこちにいっぱい作るという感じです。」とも述べている[59]。
AlphaGoが発表されてから、他のソフトもディープラーニングの手法を取り入れて大幅に棋力を伸ばし、2017年3月の第5回電聖戦では初めて互先でコンピュータ囲碁側(DeepZenGo、絶芸)が勝利した。2局とも中押し勝ちだった。
脚注
- ^ a b c d e “Research Blog: AlphaGo: Mastering the ancient game of Go with Machine Learning”. Google Research Blog (27 January 2016). 2016年1月29日閲覧。
- ^ a b c “Google achieves AI 'breakthrough' by beating Go champion”. BBC News (27 January 2016). 2016年1月29日閲覧。
- ^ “囲碁AIに「名誉九段」授与=韓国棋院=”. 朝鮮日報 (15 March 2016). 2016年3月15日閲覧。
- ^ “中国围棋协会授予AlphaGo职业九段 并颁发证书” (Chinese) (27 May 2017). 29 May 2017閲覧。
- ^ “世界トップ棋士を制したGoogleの囲碁AI「AlphaGo」、引退へ” (2017年5月29日). 2017年5月29日閲覧。
- ^ “After Win in China, AlphaGo’s Designers Explore New AI” (2017年5月27日). 2017年6月2日閲覧。
- ^ “[Breaking AlphaGo victorious once again”]. THE KOREATIMES. (2016年3月10日) 2016年3月11日閲覧。
- ^ Number of legal Go positions
- ^ Silver, David; Huang, Aja; Maddison, Chris; Guez, Arthur; Sifre, Laurent; van den Driessche, George; Schrittwieser, \tJulian; Antonoglou, Ioannis et al. (2016-01-28). “Mastering the game of Go with deep neural networks and tree search”. Nature .
- ^ Wedd, Nick. “Human-Computer Go Challenges”. computer-go.info. 2011年10月28日閲覧。
- ^ 日本棋院が協力する電聖戦では4子から3子のハンディキャップを付けていた
- ^ “Computer scores big win against humans in ancient game of Go”. CNN (28 January 2016). 28 January 2016閲覧。
- ^ Johnson, George (1997-07-29), “To Test a Powerful Computer, Play an Ancient Game”, The New York Times 2008年6月16日閲覧。
- ^ “Google AlphaGo AI clean sweeps European Go champion”. ZDNet (28 January 2016). 28 January 2016閲覧。
- ^ 「アルファ碁ゼロ」が登場、完全な教師なし学習で世界最強に
- ^ 世界最強の碁プログラム・AlphaGoの新バージョン「AlphaGo Zero」はもう自力で強くなれるレベルに到達
- ^ 「AlphaGo Zero」──ビッグデータ不要のAI棋士が自己対局のみで世界最強に
- ^ グーグルの最新AI「AlphaZero」は、3つのゲームで人間を超えた──その実力と「次のステップ」
- ^ “Google achieves AI 'breakthrough' by beating Go champion - BBC News” (27 January 2016). 28 January 2016閲覧。
- ^ a b c Elizabeth Gibney (27 January 2016), “Go players react to computer defeat”, Nature, doi:10.1038/nature.2016.19255
- ^ “AlphaGo defeats Lee Sedol in first game of historic man vs machine match”. Go Game Guru (9 March 2016). 9 March 2016閲覧。
- ^ “Zen computer Go program beats Takemiya Masaki with just 4 stones!”. Go Game Guru. 28 January 2016閲覧。
- ^ “「アマ六段の力。天才かも」囲碁棋士、コンピューターに敗れる 初の公式戦”. MSN Sankei News. 27 March 2013閲覧。
- ^ Dana Mackenzie (9 March 2016). “Update: Why this week’s man-versus-machine Go match doesn't matter (and what does)”. Science. doi:10.1126/science.aaf4152 .
- ^ Ben Kloester (4 March 2016). “Can AlphaGo defeat Lee Sedol?”. Go Game Guru. 10 March 2016閲覧。
- ^ “AlphaGo Korean Press Briefing” (28 January 2016). 10 March 2016閲覧。
- ^ “Mastering the game of Go with deep neural networks and tree search”. Nature (28 January 2016). 28 January 2016閲覧。
- ^ a b “アルファ碁、最終局も制す 最強・李九段に4勝1敗”. 朝日新聞. (2016年3月15日) 2016年3月15日閲覧。
- ^ https://twitter.com/demishassabis/status/816660463282954240
- ^ “「AlphaGoは李世ドルに勝っても、僕には勝てない」 世界最強の囲碁棋士(18歳)がコメント”. ねとらぼ. ITmedia (2016年3月9日). 2017年5月16日閲覧。
- ^ “World's Go Player Ratings” (March 2016). 2017年5月16日閲覧。
- ^ “揭秘谷歌围棋战大赢家:柯洁微博粉丝翻20倍”. 新浪科技 (2016年3月10日). 2017年5月16日閲覧。
- ^ “人机终极对决或年内举行柯洁将战AlphaGo”. 新浪網 (2016年6月8日). 2017年5月16日閲覧。
- ^ a b “囲碁の神秘を求めて ーー Future of Go Summit 開催”. Google (2017年4月10日). 2017年5月23日閲覧。
- ^ “米アルファ碁「世界最強」降す 柯九段「強くなった」”. 毎日新聞 (2017年5月24日). 2017年5月24日閲覧。
- ^ “米グーグルのAI、世界最強の中国囲碁棋士に第1局で勝利”. ロイター (2017年5月24日). 2017年5月24日閲覧。
- ^ “囲碁AIが世界最強棋士に連勝 開発会社CEOは柯九段の健闘たたえる”. 産経ニュース (2017年5月26日). 2017年5月26日閲覧。
- ^ “トップ棋士5人でも敗北 アルファ碁実力示す、中国”. 産経ニュース (2017年5月26日). 2017年5月26日閲覧。
- ^ “「AlphaGoは楽しい」対局中のプロ棋士5人の笑顔が物語るもの:現地レポート”. WIRED (2017年5月27日). 2017年5月27日閲覧。
- ^ “「AlphaGo」という“神”の引退と、人類最強の19歳が見せた涙の意味:現地レポート”. WIRED (2017年5月28日). 2017年5月29日閲覧。
- ^ “AIアルファ碁3連勝「人間との対局は終える」”. 読売新聞 (2017年5月26日). 2017年5月27日閲覧。
- ^ “「アルファ碁」足掛かりに中国再参入を目指すグーグル”. WSJ. 2017年5月29日閲覧。
- ^ “Google deploys AI for Go tournament in China charm offensive AlphaGo”. Financial Times. 2017年5月27日閲覧。
- ^ “Chinese Go master Ke Jie loses to Google's AlphaGo in first of three-game match - People's Daily Online”. 人民網. 2017年5月27日閲覧。
- ^ “中国、アルファ碁との対局中継取り消し グーグルとの確執関係か”. 産経ニュース (2017年5月24日). 2017年5月23日閲覧。
- ^ “Google’s AlphaGo Defeats Chinese Go Master in Win for A.I.”. ニューヨーク・タイムズ (2017年5月24日). 2017年5月23日閲覧。
- ^ “グーグル、中国にAI研究センターを開設--「この種の研究施設はアジア初」”. CNET (2017年12月14日). 2017年12月15日閲覧。
- ^ “Google launching artificial intelligence research center in China”. 新浪 (2017年12月13日). 2017年12月15日閲覧。
- ^ 「AlphaGo Zero」──ビッグデータ不要のAI棋士が自己対局のみで世界最強に
- ^ 棋譜学ばず「独学3日」、最強の囲碁AI誕生
- ^ 自己対局で成長する囲碁AI「AlphaGo Zero」が登場--実力すでに世界最強
- ^ https://wired.jp/2017/12/08/deepmind-alphazero/
- ^ 「囲碁AI新時代」p. 38 マイナビ出版, 王銘琬著
- ^ Silver, D. et al. Mastering the Game of Go with Deep Neural Networks and Tree Search. Nature. 2016. 529(7587), p.484-489.
- ^ Connor, Steve (2016年1月27日). “A computer has beaten a professional at the world's most complex board game” (英語). 'The Independent'. 2016年1月28日閲覧。
- ^ “Google's AI beats human champion at Go”. CBC News (2016年1月27日). 2016年1月28日閲覧。
- ^ Müller, Martin. Computer Go, Artificial Intelligence 134 (2002): p150
- ^ チョン・ヒョンソク (2017年3月12日). “原因は「アルファ碁」!?韓国で囲碁人気失速”. 朝鮮日報. 2017年3月12日時点のオリジナルよりアーカイブ。2017年3月14日閲覧。
- ^ “コンピュータはより人間らしくなった!?「天頂の囲碁」ソフト開発者インタビュー”. ニュースウォーカー (2016年7月14日). 2017年4月23日閲覧。
関連項目
- DQN (コンピュータ) - Google DeepMindが開発した人工知能
外部リンク
- AlphaGo公式サイト
- AlphaGoが自身と対局した50局 - AlphaGoの遺産