DeepMind社がやねうら王に注目し始めたようです

投稿日時: 2017年12月7日投稿者: やねうらお

DeepMindがAlphaGo Zeroで使われた手法をチェスと将棋に適用して、チェスと将棋の世界でもぶっちぎり強いソフトが出来たそうです。(私は、内容は詳しく読んでいません。)

おーDeepMindの論文にelmoデビューしとる。でもElmoって書いてあるから個人的にリジェクトで。しかし強い。DeepMind凄いね。https://t.co/o5SmgmH6KG

— 瀧澤誠@elmo (@mktakizawa) December 6, 2017

RT> DeepMindの論文にやねうら王の文字があるんだけどｗ　何か知らないけど、やねうら王、世界的にデビューしてた！！ pic.twitter.com/HVb1CZKue6

— やねうら王 (@yaneuraou) December 6, 2017

まあ、ResignValue = 900 (評価値が-900を下回った時点で投了扱い)になっているので、それで本当に強さが計測できているのかだとか、Hash(置換表サイズ)1GBは少なすぎだとか、定跡オフなので同じ試合ばかりになっていないかだとか、やねうら王がトーナメント版ではないだとか、1手1分固定なのは時間の使い方としてどうなのみたいな部分もなくはないですが、それでもelmo(WCSC27)+R500ぐらいは強いようなので色々差し引いても現時点で世界最強なのには間違いありません。

まあ、最新のやねうら王 + Apery(SDT5)の評価関数との差はおそらくR200〜250ぐらいですかね。半年後ぐらいには普通に手が届く範囲です。むしろ、向こうはTPU(GPUの15〜30倍ぐらいの性能があるらしい)を4機も使っています。2倍速になるごとにR200上がる世界で、これはずるいような気はします。無論、NNでここまで強く出来たことは素晴らしい成果で文句のつけようもないのですが、Googleの技術力と資本力を持ってしてもNNだとこれくらいにしか強くならなかったのかというガッカリ感もあります。

あと、「わずか2時間弱でここまで強くなった」というのはニュースとしては衝撃的ですが、実際は5000TPU使ってますからね…。たぶんGCP(クラウド)でこれだけの計算資源を使おうとすると数千万円はかかるような…。(料金体系はよく知りません) やねうら王もAWSに数千万円使っていいなら、R500ぐらい余裕で上げられてると思いますし。

とりあえず、俺たちの戦いはまだ始まったばかりだ！！

補足 2017/12/8 9:30 　文中の「これくらいにしか強くならなかった」というのは、チェスのほうとの比較です。チェスのほうはぶっち切り強くなっていて、チェスの強豪ソフトであるStockfishに完勝(無敗)しています。それに対して将棋のほうは、まだ半年後ぐらいに普通に追いつける程度でしかありません。

「DeepMind社がやねうら王に注目し始めたようです」への20件のフィードバック

Yakitori 2017年12月7日 19:32 より:

グーグルが出てくると金製のバットでタコ殴りって感じになるんでしょうかね。
まぁ、彼らの実力のすべてを出したかどうかわからないのでもっと余地はあるのかもしれないですね。
とりあえず、最強になってみた的なワナビーな感じだと思います。
まだ伸びしろがある事がわかったのは逆に収穫かもしれないですよ？

返信 ↓
- やねうらお 2017年12月7日 19:36 より:
  
  ハードウェア構成が全然違うので、この結果を以て伸びしろがあると言って良いのかどうか…。
  
  返信 ↓
Bonta 2017年12月7日 19:58 より:

>>俺たちの戦いはまだ始まったばかりだ！！
ちょｗ　急に打ち切りで最終回なっちゃってるじゃないっすかｗ

返信 ↓
- やねうらお 2017年12月7日 20:00 より:
  
  気づいてもらえましたかｗ　わかってくれる人がいて嬉しいです。
  
  返信 ↓
シーサー 2017年12月7日 20:49 より:

つい最近まで「人工知能が将棋でトッププロに勝った、囲碁でトッププロに勝った
と言っても、それは特化型AIで将棋AIには囲碁はできず、囲碁AIは将棋ができない（ので、まだまだ恐るるに足らず）」
ってこと言ってる人も多かったですが
同じようなアプローチで全く異質なゲームが攻略できるとは…
想像以上に早く汎用性が一段上がった感じでびっくりです

返信 ↓
- やねうらお 2017年12月7日 20:58 より:
  
  汎用性は一段どころか10段ぐらい向こうのほうが上ですね…。ソースコードもきっとやねうら王の1/10ぐらいしか無いに違いなくて。いやはや、凄い時代になりました。
  
  返信 ↓
にるばんな 2017年12月7日 21:03 より:

とうとうラスボスの登場ですね！さしずめポナンザがバラモスとするとアルファ将棋はシドーですか。

返信 ↓
ポイド 2017年12月7日 21:21 より:

ご家庭で高級料亭の味を手軽に楽しめるレトルト（100万）てな感じが売りなんでしょうね。
買い手が分かりませんが。

返信 ↓
ジノノシヴ 2017年12月7日 22:27 より:

アルファ碁の論文は資源が違いすぎて再現性がないですよね･･･(笑)

返信 ↓
- やねうらお 2017年12月7日 22:33 より:
  
  そうですね。まあ、NNの界隈って、ASIC化などで1,2年で飛躍的に進歩するので来年か再来年には100万円ぐらいで再現できてもおかしくはないですけども。
  
  返信 ↓
もきゅ 2017年12月8日 21:41 より:

ディープマインドの発表はいつも事実かどうかはわかりませんが信用度はどのくらいだとお考えですか？

返信 ↓
- やねうらお 2017年12月9日 07:22 より:
  
  やねうら王の設定がちょっと怪しげですが、それを除けば、内容自体は、まあ信用できるのではないかと…。
  
  返信 ↓
まふ 2017年12月9日 09:44 より:

やねさんが顧問している
お多福ラボって
将棋のディープラーニング挑戦してみないんです？

自分のブログの初心者向けに将棋の本質ってことで記事にする予定でしたけど、多分私の定跡理論
（ドメイン知識）
をプログラムに落とし込むだけで、
AlphaZeroの学習効率が軽く１０倍
下手したら１００倍とか行きそうな気がしてて、どうしたものかと思ってます。

本気でやるなら何か資料作って送りますけども。
（たぶん、やねさんレベルにコンピュータ将棋歴が長い人ほど一瞬で理解出来る内容です）

返信 ↓
- やねうらお 2017年12月9日 09:53 より:
  
  『お多福ラボ』のほうは、いまのところその余力がないですね…。ディープラーニングの将棋自体は私も来年、気が向いたらやります。
  
  > 本気でやるなら何か資料作って送りますけども。
  
  く、、ください(｀･ω･´)つ
  
  返信 ↓
  - まふ 2017年12月9日 09:59 より:
    
    わかりました！
    とりあえず概略だけ作ってツイッターDMします。
    １週間程度お待ち下さい。
    
    返信 ↓
    - やねうらお 2017年12月9日 11:23 より:
      
      (｀･ω･´)ゞはい
      
      返信 ↓
りちゃぼう 2017年12月9日 21:50 より:

DeepMindの人に「棋譜公開しろ」というメールを１万通くらい出しませんか？

返信 ↓
- やねうらお 2017年12月9日 23:29 より:
  
  DeepMindのなかの人に「将棋ファンはうざいぞ」と思われちゃうと、将棋ソフトにこれ以上、関わってくれなくなると嫌なので私は静観してます。
  
  返信 ↓
Yakitori 2017年12月17日 08:21 より:

なんか思ったんですけど、
リゼロのアプローチをディープマインドにパクられた気がします。
気のせいかもしれませんが。
ゼロから自動で形式のようなモノを持つというアプローチはほんとに賞賛されるべきでここでは小さなことかもしれませんが転用すればかなりいろんなことを秘めた技術に思います。
ホント論文書くべきじゃないかと思いますよ。それに値すると思いますし、波及する効果は予想不可能です。自分にとって。

返信 ↓
ゴールド棋神 2018年3月23日 08:42 より:

将棋の真髄を学ぶがよい♥️！

返信 ↓

やねうら王公式サイト

コンピューター将棋やねうら王公式サイト

DeepMind社がやねうら王に注目し始めたようです

「DeepMind社がやねうら王に注目し始めたようです」への20件のフィードバック

コメントを残すコメントをキャンセル

「DeepMind社がやねうら王に注目し始めたようです」への20件のフィードバック

コメントを残す コメントをキャンセル

コメントを残すコメントをキャンセル