BERT-MCTSはトッププロの棋力を超えるのか?

プロ棋士の谷合廣紀四段がBERTを使った将棋ソフトを公開されたので、この棋力を検証してみました。(他の人が)

// 前回 → プロ棋士の谷合廣紀四段がBERTを使った将棋ソフトを作られました : https://yaneuraou.yaneu.com/2021/05/15/bert-mcts/

谷合さんのGitHubでは、学習されたモデル(ckptというファイル)として、2種類公開されていました。どうやら、ヨビノリさんのYouTube動画撮影当時のものと、そこから数日さらに学習させたもののようです。

たまさんが、前者の方をGTX1050Ti(かなりロースペックのGPU)でfloodgateに投入されたのですが、20nps(1秒間に20局面)ぐらいしか読めなくて、floodgateでcoduck(これはラズパイで動いているソフトでR2200。下位の基準ソフト的な役割)にも勝てなくて、レートがつきませんでした。おそらくR1000-1800のどこか。

それで、たまさんが、上の後者のckptに差し替えたところ、coduckには安定して勝てるようになったらしく、現在、R2372です。(=将棋倶楽部24換算でR2182(四段))

そんなわけで、2つあったckpt、後者の方は前者よりR500ぐらい強くなっているのだと思います。学習はまだこのまま継続していけばさらに強くなるのかも知れません。

また、RTX3090だとGTX1050Tiの5倍以上のnpsが出るらしく、たぶんそれで+R300ぐらい上がると思われます。

あと、このプログラム、Pythonで書かれていて、合法手生成などはcshogiというPythonのライブラリ(内部的にはC++で実装されています)を呼び出すのですが、それ以外の部分はやはり遅いので、そこが足を引っ張っている意味もあります。ふかうら王の方で、この学習モデルの読み込みに対応させれば、npsは劇的に上がるはずです。

諸々合わせて考えると、これ(このBERT+MCTSという手法)で少し頑張ればトッププロの棋力(floodgateでR3000-3500?)には到達するんじゃないかと私は見てます。

現役のプロ棋士の作ったフルスクラッチに近いソフトが、現役のプロ棋士(御自分)を倒すという、歴史的快挙、いや、自分のソフトに負けるのだから歴史的敗北?を達成される日は近そうです。

ふかうら王では、BERT-MCTS対応のプルリクをいつでも受け付けております。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です