最高峰将棋AIによる長時間対局、プロ棋士3名が解説

先日、将棋ソフトの大会である第2回世界将棋AI電竜戦TSECが開催され、やねうら王チームのたややんさんの将棋ソフトである水匠が総合優勝を果たした。

dlshogiは予選落ち(本戦には2ソフトしか残れない)したのだが、dlshogiは予選落ちした48チームのなかで優勝を果たした。dlshogiの開発者の山岡さんによると、「予選は学習が間に合わずいまいちな成績でしたが、本選では調整が間に合いR+150くらい強くなっていました。」とのことらしいが、「まだあそこから+R150も上がるのか！」と周囲を驚かせている。

// 第2回電竜戦TSEC 結果報告 : https://tadaoyamaoka.hatenablog.com/entry/2021/07/18/173459

今回、総合優勝した水匠とこの+R150も強くなったdlshogiとの親善試合が開催されることになった。それも長時間での対局である。対局の様子はYouTubeで配信され、プロ棋士の方が3名も解説に来られるそうである。噂によると渡辺明名人もゲストで来られるのだとか。

詳しい内容に関しては以下の告知動画をどうぞ。

【2021.8.15 17:00~】最強将棋AI決戦を豪華プロ棋士3名に解説いただきます！【電竜戦公式チャンネル開設記念】

2021年8月15日当日の放送は、電竜戦公式チャンネルで配信される予定。

電竜戦公式チャンネル
https://www.youtube.com/channel/UCVecG5AhJTZKcqlAZju25Og

今回の見どころ

水匠は従来型のソフトの代表格で、やねうら王探索部(Stockfish風の探索部)＋NNUE評価関数。
dlshogiはDeepMind(現Google)のAlphaZero型のソフトでDeep Learningを用いた将棋ソフト。

floodgate(15分切れ負けルール)では、以前のdlshogiは水匠にR100～200程度の差をつけられている状態であったが、dlshogiが+R150も強くなったなら、floodgate上は同じぐらいのレーティングだと考えられる。果たして長時間対局で強いのはどちらなのか。

一般的に、Deep Learningを用いた将棋ソフトの方が評価関数の精度が高く、局面評価が正確なので大局観に優れている。だから、長時間になるとDeep Learning系の将棋ソフトのほうが強いと考えるのが自然なのだが、ところがStockfish風の探索部はとても優秀なのだ。

Stockfish風の探索部は、例えば詰み筋を一つ見つけると他の兄弟局面でもその詰み筋を試す。他の兄弟局面でも同じ詰み筋で詰むことが多いから、将棋においてはこのような方法により、大幅に探索量を減らすことができる。Deep Learning系の将棋ソフトではいまのところ、そのような探索の仕方をしていないので、中終盤においては従来型の探索部よりずいぶんと損をするようである。

だから、長時間対局で強いのかどちらなのかと問われるとなかなか難しいものがある。DeepMindがAlphaZeroの論文を最初に発表した時には、長い持ち時間になればなるほど従来型のソフト(elmo WCSC27)よりAlphaZeroの方が強いというような主張が含まれていたのだが、その後、その主張は撤回された。

dlshogiはAlphaZeroからさらに工夫を重ねたソフトであるし、水匠も当時の探索部(elmo WCSC27)からは格段の進歩をしている。このような状況で、長い持ち時間でどちらが強いのかは全く予想がつかない状態である。dlshogiが序盤の巧さでそのまま押し切ってしまうのか、水匠が終盤の魔術で勝ちを拾うのか。

明日告知予定の将棋AIの大型イベントの件、テロップをつけるためにVrewという文字起こし＆テロップをつけてくれるサービスを利用したところ、「将棋AI」が軒並み「葬儀屋」と文字起こしされたようで我々がいまからやろうとしているのは葬儀屋の祭典であることが判明した。 pic.twitter.com/DmLVMXLJZ1
— やねうら王 (@yaneuraou) August 2, 2021