"BOKU"のITな日常

還暦越えの文系システムエンジニアの”BOKU”は新しいことが大好きです。

アルファ碁ゼロ(AlphaGoZero)の技術情報がオープンになってる驚き

ディープラーニングに興味のあって、アルファ碁(AlphaGo)を知らない人はいないんじゃないですかね。

そのくらいインパクトがありました。

 

アルファ碁のバージョン

 

アルファ碁(AlphaGo)には、いくつかのバージョンがあります。

  • AlphaGo Fan:初代。初めてプロ棋士(樊麾)に勝利(5戦5勝)。
  • AlphaGo Lee:2代目。世界トップ棋士の一人の李世乭に勝利(4勝1敗)。
  • AlphaGo Master:3代目。ネット碁でプロ棋士に60連勝。人類最強の柯潔に3戦全勝。
  • AlphaGo Zero:4代目。AlphaGo Leeに100戦全勝、AlphaGo Masterに89勝11敗。
  • AlphaZero:汎用版。将棋、チェスの最高峰のAIに勝利し、AlphaGo Zeroも上回る。

3代目くらいから、もう人間が勝てる相手ではなくなってしまいました。

4代目からは前の代のAlphaGoと勝負して勝ちまくるという・・。

とんでもない境地にたどり着いてしまいました。

しかも。

先代の資産(学習結果)を引き継いで蓄積することで進化したということではなく、毎回、新しい技術を採用しているところがすごいです。

 

ゼロから強くなるを実現してしまった!

 

アルファ碁ゼロ(AlphaGoZero)からは「教師データがない状態で自分自身と対戦しながら、文字通りゼロから強くなる」ということまで実現してしまいました。

DeepMind社は「tabula rasa(白紙の状態から勝手に知識を身につけるAI)」などというとんでもないものを目指しているらしいですが・・、いや、着々と近づいているから恐ろしくなります。

だから。

勝手に自分らにとって未知のとんでもない技術や高度に数学的な理論で実現されているんだろうと考えていました。

かつ、その技術は秘中の秘とかなんだろうなと。

 

技術の全貌を論文として公開してる

 

ところが。

DeepMind社はその技術の全貌を、毎回ネイチャー誌の論文として発表していたのですねえ。

これは。

実現した技術を公開して誰かに真似をされても、そのころには自分らは、それが陳腐に見えるような境地にたどり着いているから痛くも痒くもねーよ。

そういう自信のなせる技なんでしょう。

いや・・。

恐れ入ります。

 

アルファ碁ゼロの日本語解説PDF

 

自分は研究者でもなければ、ネイチャー誌も読んでません。

わざわざ「アルファ碁」なんてキーワードでググることも・・まあ、なかったです。

なので、知らなかったのですが、たまたま、別の情報をググっていて、それで開いてみたPDFが「アルファ碁ゼロ」の日本語での解説だったという偶然で知りました。

それがこれです。

http://home.q00.itscom.net/otsuki/alphaZero.pdf

f:id:arakan_no_boku:20190111201439j:plain

6章とかあるので、どうも、本の一部っぽいなと思って探したら、こんな本もでてるんですね。 

 

既存の技術の功名な組合せで実現してるんだという驚き

 

PDFは読みました。

完全に理解はできませんが、でてくるひとつひとつ・・モンテカルロ法とかresNetとか・・は既存の技術ばかりで、それを巧妙に組み合わせることで実現しているんだということに驚きます。

その内容を偉そうに引用して解説の真似事をする気はありませんし、正直、できるほど理解できているとも思えません(笑)

内容が知りたければ、上記のPDFを読むか、本を買って読めばいいと思います。

滅茶苦茶、勉強になると思います。

 

まあ、Google以外には用意できないハードウエアが必要だけど

 

ただ、理解できたとしても。

実際にアルファ碁ゼロに学習させて動かすことができるか・・というと、そこにはとてつもない壁があります。

PDFから引用します。

この 3 日間という数字は、私の仮説では、4TPU 搭載マシン 1000 台程度の環境を使った結果です。
CPU を 1 個だけ搭載した普通の PC を使った場合、手元の計算では 20,000 年かかる計算量です。

だそうです。

自分の環境だと、20000年ですか?

囲碁というゲームがうんぬん以前に、人間は存在してるんですかねえ。

 

TPUとは

 

ちなみに、TPUというのはGoogleが開発した「ディープラーニング専用プロセッサ」で市販はされてないそうです。

www.atmarkit.co.jp

上で引用している「4TPU搭載マシン」は

 CPU2400 個もしくは、GPU120個程度の並列に相当する膨大な計算量になります。

だそうです。

市販されていないのを、Googleにかけあってみたとして、価格はどのくらいするんでしょうね。

GPUが40万円・50万円とかしてるくらいですから、TPU1基は100万円くらいは最低するでしょうね。

そしたら、ハードだけでも400億円以上・・・。

まあ、クラウドで貸してもらうとして、試してみるのに億単位のお金がかかるのは避けようがないのかな。

うーーん。

なるほど・・現実味がないです(笑)