Stockfish NNUEに関する主観的レビュー

投稿日時: 2020年6月21日投稿者: やねうらお

前回記事では、Stockfish NNUE(以下SF NNUEと略す)に関する情報を、英語圏の人達に届けるために書いたので、将棋界隈の人達が知りたい情報ではなかった気がするので、今回は、将棋界隈の人たちのためにざっと流れを書いておきます。

SF NNUEの強さについて

最新のStockfishはバージョン11(SF11)で、これは一つ前のバージョンであるStockfish 10(SF10)とは70-80 eloの差があるそうです。(知りませんでした)

SF NNUEは、10日前の時点で、SF10とほぼ同等らしく、今日の時点でSF10よりは強くなっていて、最終的にはStockfish 11より+100 eloぐらい強くなるのでは？と噂されています。(この辺は、期待値込み？)

SF NNUEのコミュニティについて

Discordのほうで、SF NNUEに関するツール類もどんどん開発されていて、活発に議論がなされています。ログを追いかけるのがしんどいぐらいの速度で進行しています。ざっくり言えば、匿名掲示板のなんとかちゃんねるに似たノリではありますが、開発力と最低限度のモラルがある分、建設的な議論がなされていると感じます。

DiscordのSF NNUEのほうに、日本の将棋AIの開発者としては現時点で、(今回NNUEをSFにportingした)tanuki-の野田さん、Mizarさん、Qhapaqの澤田さん、elmoの瀧澤さんが参加されているようです。

将棋のほうでもNNUEをゼロから学習させた経験があるのはごくわずかの開発者だけで(ほとんどの開発者はtanuki- WCSC28からの追加学習)、このへんのノウハウ自体がそもそも日本人の将棋AI開発者の間で共有されていない状況ですが、SF NNUEのコミュニティのなかで今回、そこが詳らかにされるのかもしれませんね。

日本の将棋AIコミュニティについて

日本の将棋AI開発者も、SF NNUEのDiscordのような雰囲気で交流できる場所があれば良いように思いますが、将棋のSlack(Noviceのkumaさんが作成)のほうは、ほとんど書き込みがないままになっています。

まあ、現状、将棋AI開発者の主戦場は、ツイッター + ブログ記事 + WCSCのPR文書 + GitHub みたいな感じになっていて、それは仕方ないとしても、思考部の開発初心者・入門者用の受け皿が、なんとかちゃんねるしかないのは、とても残念なところです。

また、ツイッターですと開発者をフォローしても将棋AI以外のノイズが大量に流れてきて(私も、そういったノイズを流している側の一人ですが)、それが純粋に情報だけを追いかけたい人にとっては、とても迷惑なのだろうとは思います。

将棋AIの棋風について

将棋AI界隈では、評価関数の形(KPPT,NNUE,…)を自由に変更できて、かつ、その評価関数パラメーターを差し替えたり、探索部だけを差し替えたりすることによって、同じぐらいの強さの様々な棋風の将棋AIが生み出されてきました。Aperyが採用したKPPT型の評価関数フォーマットをやねうら王が読み込めるようにしたころから、その流れが加速したように思います。

やねうら王は、評価関数、探索部、定跡部などすべてがモジュール(部品)として構成されていて、自由にその部品を交換できるという設計思想のもとに開発していました。(技術的な問題から、綺麗に独立したモジュールとは言い難いですが、少なくとも評価関数の形を切り替えたり、Aperyの定跡フォーマットの定跡ファイルを読み込んだりはできます)

5年ぐらい前にPonanzaの山本君にこの話をした時、「そんなことすんの？」(自分は強さにしか興味ない)、みたいな感じでしたが、その設計思想の正しさが、5年の歳月を経て証明されたと言えそうです。

SF NNUEの棋風について

将棋AIでソフトごとに評価関数パラメーターが異なり、棋風が異なるのは当たり前であったので私はすっかり忘れていたのですが、SF界隈ではこれは当たり前ではなかったのです。

SF NNUEのほうは、追加学習させるごとに違った棋風(ある局面での指し手)になることに興奮している人たちがいるようで、これはSF界隈に大きなインパクトがあるようです。現時点でも、棋風がそれぞれ異なる、SF10と同程度の強さのソフトが大量生産できるような状況であるので、そりゃ興奮するのも無理ないだろう、ということです。

SFの従来の評価関数と SF NNUE

SFの従来の評価関数はいかにも職人的に設計されたと言う感じの評価関数でした。GitHubでその修正履歴を追いかけるのが大変なほどに長い時間を費やされ、この評価関数が開発されてきました。それがSF NNUEのような、ニューラルネットワーク型の評価関数で置き換わるとしたら、それは歴史的な事件であると言えます。

評価関数を単純化して言えば、盤面情報(駒の位置情報)を入力として、その局面での同じ棋力のプレイヤー同士が対局を引き継いだときの勝率(期待勝率)を予測する、数学的な意味での関数です。SFでは精度はそれほど高くなくとも計算コストが非常に小さな評価関数を人間の職人が設計してきました。

このようなとても小さな評価関数ですら、職人がそれを懸命に設計するより、ニューラルネットワークのような、任意の関数の近似ができることが保証されている汎用的な手法を使ったほうが(層が浅いので、実際は任意の関数の近似はできないにせよ)、同じ計算コストでより良い近似ができる関数になるというのは、職人(人間)の敗北という感じではあります。

これは、ML(機械学習)の一つのムーブメントとして、今後、幾度となく取り上げられることでしょう。

情報ソース

Discord for Stockfish
https://discord.gg/aefaxmq

Discord #sf-nnue-dev
https://discord.com/channels/435943710472011776/718853716266188890

SF NNUE #2728(Official Stockfish GitHub)
https://github.com/official-stockfish/Stockfish/issues/2728