DeepMindがAlphaGo Zeroで使われた手法をチェスと将棋に適用して、チェスと将棋の世界でもぶっちぎり強いソフトが出来たそうです。(私は、内容は詳しく読んでいません。)
おーDeepMindの論文にelmoデビューしとる。でもElmoって書いてあるから個人的にリジェクトで。しかし強い。DeepMind凄いね。https://t.co/o5SmgmH6KG
— 瀧澤 誠@elmo (@mktakizawa) December 6, 2017
RT> DeepMindの論文にやねうら王の文字があるんだけどw 何か知らないけど、やねうら王、世界的にデビューしてた!! pic.twitter.com/HVb1CZKue6
— やねうら王 (@yaneuraou) December 6, 2017
まあ、ResignValue = 900 (評価値が-900を下回った時点で投了扱い)になっているので、それで本当に強さが計測できているのかだとか、Hash(置換表サイズ)1GBは少なすぎだとか、定跡オフなので同じ試合ばかりになっていないかだとか、やねうら王がトーナメント版ではないだとか、1手1分固定なのは時間の使い方としてどうなのみたいな部分もなくはないですが、それでもelmo(WCSC27)+R500ぐらいは強いようなので色々差し引いても現時点で世界最強なのには間違いありません。
まあ、最新のやねうら王 + Apery(SDT5)の評価関数との差はおそらくR200〜250ぐらいですかね。半年後ぐらいには普通に手が届く範囲です。むしろ、向こうはTPU(GPUの15〜30倍ぐらいの性能があるらしい)を4機も使っています。2倍速になるごとにR200上がる世界で、これはずるいような気はします。無論、NNでここまで強く出来たことは素晴らしい成果で文句のつけようもないのですが、Googleの技術力と資本力を持ってしてもNNだとこれくらいにしか強くならなかったのかというガッカリ感もあります。
あと、「わずか2時間弱でここまで強くなった」というのはニュースとしては衝撃的ですが、実際は5000TPU使ってますからね…。たぶんGCP(クラウド)でこれだけの計算資源を使おうとすると数千万円はかかるような…。(料金体系はよく知りません) やねうら王もAWSに数千万円使っていいなら、R500ぐらい余裕で上げられてると思いますし。
とりあえず、俺たちの戦いはまだ始まったばかりだ!!
関連記事 : 「AlphaGo」から進化 将棋とチェスでも世界最強「AlphaZero」(ITmedia)
補足 2017/12/8 9:30 文中の「これくらいにしか強くならなかった」というのは、チェスのほうとの比較です。チェスのほうはぶっち切り強くなっていて、チェスの強豪ソフトであるStockfishに完勝(無敗)しています。それに対して将棋のほうは、まだ半年後ぐらいに普通に追いつける程度でしかありません。
グーグルが出てくると金製のバットでタコ殴りって感じになるんでしょうかね。
まぁ、彼らの実力のすべてを出したかどうかわからないのでもっと余地はあるのかもしれないですね。
とりあえず、最強になってみた的なワナビーな感じだと思います。
まだ伸びしろがある事がわかったのは逆に収穫かもしれないですよ?
ハードウェア構成が全然違うので、この結果を以て伸びしろがあると言って良いのかどうか…。
>>俺たちの戦いはまだ始まったばかりだ!!
ちょw 急に打ち切りで最終回なっちゃってるじゃないっすかw
気づいてもらえましたかw わかってくれる人がいて嬉しいです。
つい最近まで「人工知能が将棋でトッププロに勝った、囲碁でトッププロに勝った
と言っても、それは特化型AIで将棋AIには囲碁はできず、囲碁AIは将棋ができない(ので、まだまだ恐るるに足らず)」
ってこと言ってる人も多かったですが
同じようなアプローチで全く異質なゲームが攻略できるとは…
想像以上に早く汎用性が一段上がった感じでびっくりです
汎用性は一段どころか10段ぐらい向こうのほうが上ですね…。ソースコードもきっとやねうら王の1/10ぐらいしか無いに違いなくて。いやはや、凄い時代になりました。
とうとうラスボスの登場ですね!さしずめポナンザがバラモスとするとアルファ将棋はシドーですか。
ご家庭で高級料亭の味を手軽に楽しめるレトルト(100万)てな感じが売りなんでしょうね。
買い手が分かりませんが。
アルファ碁の論文は資源が違いすぎて再現性がないですよね・・・(笑)
そうですね。まあ、NNの界隈って、ASIC化などで1,2年で飛躍的に進歩するので来年か再来年には100万円ぐらいで再現できてもおかしくはないですけども。
ディープマインドの発表はいつも事実かどうかはわかりませんが信用度はどのくらいだとお考えですか?
やねうら王の設定がちょっと怪しげですが、それを除けば、内容自体は、まあ信用できるのではないかと…。
やねさんが顧問している
お多福ラボって
将棋のディープラーニング挑戦してみないんです?
自分のブログの初心者向けに将棋の本質ってことで記事にする予定でしたけど、多分私の定跡理論
(ドメイン知識)
をプログラムに落とし込むだけで、
AlphaZeroの学習効率が軽く10倍
下手したら100倍とか行きそうな気がしてて、どうしたものかと思ってます。
本気でやるなら何か資料作って送りますけども。
(たぶん、やねさんレベルにコンピュータ将棋歴が長い人ほど一瞬で理解出来る内容です)
『お多福ラボ』のほうは、いまのところその余力がないですね…。ディープラーニングの将棋自体は私も来年、気が向いたらやります。
> 本気でやるなら何か資料作って送りますけども。
く、、ください(`・ω・´)つ
わかりました!
とりあえず概略だけ作ってツイッターDMします。
1週間程度お待ち下さい。
(`・ω・´)ゞはい
DeepMindの人に「棋譜公開しろ」というメールを1万通くらい出しませんか?
DeepMindのなかの人に「将棋ファンはうざいぞ」と思われちゃうと、将棋ソフトにこれ以上、関わってくれなくなると嫌なので私は静観してます。
なんか思ったんですけど、
リゼロのアプローチをディープマインドにパクられた気がします。
気のせいかもしれませんが。
ゼロから自動で形式のようなモノを持つというアプローチはほんとに賞賛されるべきでここでは小さなことかもしれませんが転用すればかなりいろんなことを秘めた技術に思います。
ホント論文書くべきじゃないかと思いますよ。それに値すると思いますし、波及する効果は予想不可能です。自分にとって。
将棋の真髄を学ぶがよい♥️!