アルファ碁ゼロ（AlphaGoZero）について調べてみました

f:id:arakan_no_boku:20200222222354p:plain

アルファ碁ゼロ（AlphaGoZero）について整理してみました

アルファ碁ゼロ（AlphaGoZero）について整理してみました

アルファ碁（AlphaGo）の技術情報のPDFをネットで見つけたので読んでみました。

アルファ碁ゼロ（AlphaGoZero）

アルファ碁（AlphaGo）は、世界最強のAI棋士です。

ja.wikipedia.org

アルファ碁（AlphaGo）には、いくつかのバージョンがあります。

AlphaGo Fan：初代。初めてプロ棋士（樊麾）に勝利（5戦5勝）。
AlphaGo Lee：2代目。世界トップ棋士の一人の李世乭に勝利（4勝1敗）。
AlphaGo Master：3代目。ネット碁でプロ棋士に60連勝。人類最強の柯潔に3戦全勝。
AlphaGo Zero：4代目。AlphaGo Leeに100戦全勝、AlphaGo Masterに89勝11敗。
AlphaZero：汎用版。将棋、チェスの最高峰のAIに勝利し、AlphaGo Zeroも上回る。

3代目くらいから、もう人間が勝てる相手ではなくなってしまい、４代目からは前の代のAlphaGoと勝負して勝ちまくるという・・。

とんでもない境地にたどり着いてしまいました。

しかも。

先代の資産（学習結果）を引き継いで蓄積することで進化したということではなく、毎回、新しい技術を採用していて、アルファ碁ゼロ（AlphaGoZero）からは「教師データがない状態で自分自身と対戦しながら、文字通りゼロから強くなる」ということまで実現してしまいました。

DeepMind社は「tabula rasa（白紙の状態から勝手に知識を身につけるAI）」を目指しているらしいです。

夢物語ではなく、着々と近づいているから恐ろしくなります。

アルファ碁ゼロ（AlphaGoZero）技術は論文として公開されている

AlphaGoの公式サイトがあります。

deepmind.com

ここでも、多少の説明はありますが、DeepMind社はその技術の全貌を、毎回ネイチャー誌の論文として発表しています。

自分は研究者でもなければ、ネイチャー誌も読んでませんが、興味があれば、こちらから買えるみたいです。

www.nature.com

買う気はないですけど（笑）

日本語の解説本もでているみたい

たまたまググっていて見つけたPDFが「アルファ碁ゼロ」の日本語での解説でした。

それがこれです。

6章とかあるので、どうも、本の一部っぽいなと思って探したら、こんな本がでてるんです。

最強囲碁AI アルファ碁解体新書増補改訂版アルファ碁ゼロ対応深層学習、モンテカルロ木探索、強化学習から見たその仕組み (AI & TECHNOLOGY)

作者: 大槻知史,三宅陽一郎
出版社/メーカー: 翔泳社
発売日: 2018/07/17
メディア: 単行本（ソフトカバー）
この商品を含むブログを見る

もう、このPDFは消えてしまってるみたいですけど、概要は、こちらのサイトに書いてあります。

codezine.jp

自分の興味のレベルだと、この記事くらいがありがたいです（笑）

とてつもないハードウェアスペックに驚いた

実のところ。

自分にはアルファ碁の技術に、それほど興味はありませんし、それを理解しようとか、勉強しようなどといういうモチベーションもありません。

じゃあ、なんでこんな記事を書いているか・・というと。

極秘情報だと思ってた技術情報が全くオープンだったことに単純に驚いた。
たまたま読んだPDFでアルファ碁ゼロに使われたハードウェアスペックに驚いた

という淳前たる「野次馬根性」が動機です。

その後者の驚いた部分を、PDFから引用します。

この 3 日間という数字は、私の仮説では、4TPU 搭載マシン 1000 台程度の環境を使った結果です。
CPU を 1 個だけ搭載した普通の PC を使った場合、手元の計算では 20,000 年かかる計算量です。

どうです。

驚きませんか。

CPUを１個だけ搭載した普通のPC・・って、自分が普段使っているパソコンです。

それでアルファ碁ゼロの学習をしたら、20000年かかると。

ありえない・・です。

金額換算してみたら・・・お金かかってるなあ・・

どのくらいお金もかかってるのか、興味がわいたので、計算してみます。

といっても、正式な金額はわかりません。

フェルミ推定でいきます。

ja.wikipedia.org

４TPUマシンの、TPUというのはGoogleが開発した「ディープラーニング専用プロセッサ」で市販はされていません。

www.atmarkit.co.jp

TPU1つの値段はわからないんですが、上で引用している「4TPU搭載マシン」のことは以下の記述からから概算してみます。

CPU2400 個もしくは、GPU120個程度の並列に相当する膨大な計算量になります。

ピンキリありますが、CPU100個分くらいの能力を持った、NVIDIAのGPUだと、100万位はするみたいですから、これで換算してみます。

www.gdep.co.jp

CPU2400個分だから、100万円のGPU24個分が4TPUになります。

つまり、４TPUだけで2400万円！です。

それを1000台・・って、240億円！！！

なんだ、これは！！

まあ、Googleのお仲間なので、半額位にしてもらったとしても（笑）、ハードというかTPUだけで120億円・・・。

これに、TPU以外のハードも必要だし、人件費も膨大にかかるでしょう。

うーーーん。

囲碁に、これだけのお金を使える。

いやあ、こうなると自分らの感覚とはかけ離れすぎて笑うしかないな感じです。

はい。

BOKUのブログ

ジャンルにこだわらず、ノートの感じで書いてます