前回記事の続きをやっていきましょう。
前回、入力をK(玉のある升 81通り) + P(玉以外の駒の種類・升を表現した通し番号 1548通り)として、1つのニューロンで穴熊に囲えるということを説明しました。
AlphaZeroのShogi版は、あっという間に従来の将棋ソフトを抜き去ったかのように喧伝されているので今回はここで少しばかり反論したい。
将棋ソフトで、対局後に自分の将棋の棋力を判定して表示してくれるものがある。あれは自分の弱点がわかってなかなか面白いと思うが、プレイヤーの棋力判定というのは、そういう自分が参考になるというだけではなく、オンラインゲームのマッチングにおいても重要である。
ゲームAIに関しては、オセロ、チェス、将棋、囲碁とすでにトッププロでも敵わないレベルに到達した。これらのゲームAIから人間が学ぶにはどうすれば良いのかということについて考えてみる。
rezero18からdepth 8で生成した教師データ、100億局面を期間限定で公開します。(2018年2月19日までの限定公開)
私のほう、発表資料の準備があまり出来てなくて、そして、こういう発表に不慣れで聞きづらかったと思う。聞きに来てくれた人たちには申し訳ない。
DeepMindがAlphaGo Zeroで使われた手法をチェスと将棋に適用して、チェスと将棋の世界でもぶっちぎり強いソフトが出来たそうです。(私は、内容は詳しく読んでいません。)