"BOKU"のITな日常

62歳・文系システムエンジニアの”BOKU”は日々勉強を楽しんでます

アルファ碁ゼロ(AlphaGoZero)ってお金かかってるなあ・・という素直な驚き

アルファ碁(AlphaGo)の技術情報のPDFをネットで見つけたので読んでみました。

f:id:arakan_no_boku:20200222222354p:plain

 

アルファ碁のバージョン

 

アルファ碁(AlphaGo)は、世界最強のAI棋士です。

ja.wikipedia.org

アルファ碁(AlphaGo)には、いくつかのバージョンがあります。

  • AlphaGo Fan:初代。初めてプロ棋士(樊麾)に勝利(5戦5勝)。
  • AlphaGo Lee:2代目。世界トップ棋士の一人の李世乭に勝利(4勝1敗)。
  • AlphaGo Master:3代目。ネット碁でプロ棋士に60連勝。人類最強の柯潔に3戦全勝。
  • AlphaGo Zero:4代目。AlphaGo Leeに100戦全勝、AlphaGo Masterに89勝11敗。
  • AlphaZero:汎用版。将棋、チェスの最高峰のAIに勝利し、AlphaGo Zeroも上回る。

3代目くらいから、もう人間が勝てる相手ではなくなっていました。

4代目からは前の代のAlphaGoと勝負して勝ちまくるという・・。

とんでもない境地にたどり着いてしまいました。

しかも。

先代の資産(学習結果)を引き継いで蓄積することで進化したということではなく、毎回、新しい技術を採用していて、アルファ碁ゼロ(AlphaGoZero)からは「教師データがない状態で自分自身と対戦しながら、文字通りゼロから強くなる」ということまで実現してしまいました。

DeepMind社は「tabula rasa(白紙の状態から勝手に知識を身につけるAI)」を目指しているらしいです。

夢物語ではなく、着々と近づいているから恐ろしくなります。

 

 

技術の全貌を論文として公開してる

 

AlphaGoの公式サイトがあります。

deepmind.com

ここでも、多少の説明はありますが、DeepMind社はその技術の全貌を、毎回ネイチャー誌の論文として発表しています。 

いや・・さすがです。

といっても。

自分は研究者でもなければ、ネイチャー誌も読んでません。

こちらから買えるみたいですけどね。

www.nature.com

買う気はないです(笑)

ところが、たまたま、別の情報をググっていて、それで開いてみたPDFが「アルファ碁ゼロ」の日本語での解説だったという偶然で知りました。

それがこれです。

f:id:arakan_no_boku:20190111201439j:plain

6章とかあるので、どうも、本の一部っぽいなと思って探したら、こんな本がでてるんです。 

もう、このPDFは消えてしまってるみたいですけど、概要は、こちらのサイトに書いてあります。

codezine.jp

 

とてつもないハードウェアスペックに驚いた

 

実のところ。

自分にはアルファ碁の技術を理解しようというモチベーションはありません。

じゃあ、なんでこんな記事を書いているか・・というと。

  • 極秘情報だと思ってた技術情報が全くオープンだったことに単純に驚いた。
  • たまたま読んだPDFでアルファ碁ゼロに使われたハードウェアスペックに驚いた

からです。

その後者の驚いた部分を、PDFから引用します。

この 3 日間という数字は、私の仮説では、4TPU 搭載マシン 1000 台程度の環境を使った結果です。
CPU を 1 個だけ搭載した普通の PC を使った場合、手元の計算では 20,000 年かかる計算量です。

どうです。

驚きませんか。

自分のPCが、「CPUを1個だけ搭載した普通のPC」です。

なので、自分がPCでアルファ碁ゼロの学習をしたら、20000年かかると。

ありえない・・です。

どのくらいお金もかかってるのか、興味がわいたので、計算してみます。

といっても、正式な金額はわかりません。

フェルミ推定でいきます。

ja.wikipedia.org

4TPUマシンの、TPUというのはGoogleが開発した「ディープラーニング専用プロセッサ」で市販はされていません。

www.atmarkit.co.jp

TPU1つの値段はわからないんですが、上で引用している「4TPU搭載マシン」のことは以下の記述からから概算してみます。

 CPU2400 個もしくは、GPU120個程度の並列に相当する膨大な計算量になります。

ピンキリありますが、CPU100個分くらいの能力を持った、NVIDIAGPUだと、100万位はするみたいですから、これで換算してみます。

www.gdep.co.jp

CPU2400個分だから、100万円のGPU24個分が4TPUになります。

つまり、4TPUだけで2400万円!です。

それを1000台・・って、240億円!!!

なんだ、これは。

まあ、Googleのお仲間なので、半額位にしてもらったとしても(笑)、ハードというかTPUだけで120億円・・・。

これに、TPU以外のハードも必要だし、人件費も膨大にかかるでしょう。

うーーーん。 

囲碁に、これだけのお金を使える。

いやあ、つくづく凄い会社ですよね。

はい。