やねうら王、mブランチとは何なのか?

WCSC30(第30回 世界コンピュータ将棋選手権)がコロナのために中止となり、代わりにWCSO1(世界コンピュータ将棋オンライン大会)が有志によって開催された。そこで優勝したのは水匠であったが、この水匠の思考エンジンは、探索部やねうら王、mブランチであった。mブランチとは何なのか。mブランチは何故強いのかについて軽く書いてみたい。

mブランチとは?

やねうら王のGitHubにあるソースコードに、有志がStockfishの最新の探索部のコードを反映させたものである。

mブランチ強いのか?

ロタさんの計測によると以下のようである。まあ、R100以上は対局回数が多くないと誤差が大きいので信頼度は低めなのだが、R100以上は強そうである。

やねうら王、Stockfishの最新の探索部、取り入れないの?

Stockfishの2018年のバージョンのまま、探索部にはあえて手を入れていない。その間にStockfish側で置換表(TranspositionTable)や指し手オーダリング(MovePicker)などには大きな変更があったので、その変更はやねうら王にも反映させてある。mブランチの作業をした人はきっと「探索部だけStockfishのものに差し替えたらそのまま動く…?やねさん、親切すぎ!」と思ったに違いない。あるいは、「やねうら王はあえて探索部を最新のStockfishに追随させていない」ということに気づいたであろう。

何故、やねうら王が最新のStockfishの探索部に追随していないかと言うと、『将棋神やねうら王』というパッケージ版のUpdate版の問題がある。このUpdate作業、諸々の事情により延び延びになっていた。最近、ようやくその作業をする時間がとれるようになってきたので、その作業をしているわけであるが、やねうら王の探索部が強くなってしまうと、『将棋神やねうら王』のUpdate版も強くなってしまい(最新のGitHubのやねうら王のソースコードからビルドしているので)、『将棋神やねうら王』のほうで用意されている段位プリセットの強さが変わってしまい、再度計測して調整しないといけないことになる。これが嫌だったので、Stockfishの探索部をあえて反映させていなかった。

やねうら王 WCSC29とは?

やねうら王 WCSC29の時点で、私の手元の開発版(以下、やねうら王dev(WCSC29)と呼ぶ)は、やねうら王のGitHubのバージョンより(探索部だけで)R110程度強いようであった。同一評価関数、類似の探索部だと相性問題もあるので、私自身はその計測はあまり信用はしていなかったのだが、やねうら王dev + tanuki-SDT5の評価関数(KPPT)が、やねうら王GitHub + NNUE(tanuki-WCSC28)よりやや強いようだったので、単純な相性の問題でもなさそうではある。

WCSC29の会場で、Noviceの開発者の熊谷さんと
熊谷「Stockfishの最新版のコードを持ってきて、探索部をきちんとチューニングすれば(いまのやねうら王より)R30ぐらいは上がるみたいなんですよね」
やね「R30どころかR100以上、上がると思いますよ」
という話をしたのを覚えている。

やねうら王dev(WCSC29)の反映

WCSC29終了直後に、やねうら王devをやねうら王のGitHubのほうに反映させたかったのだが、上に書いた通り、『将棋神やねうら王』のUpdate作業に影響に影響が出るので、その時は、探索部の性質(棋力)をなるべく変えないように細心の注意を払いながら更新した。

『将棋神やねうら王』のUpdate作業(Update3)は、そろそろ作業が終わるので、それが終われば、やねうら王dev(WCSC29版)をやねうら王のGitHubに反映させる予定である。(やねうら王 V5.00になる予定)

mブランチとやねうら王dev(WCSC29)との差

mブランチとやねうら王dev(WCSC29)とで、どれくらいの差があるのかは計測していないのでよくわからない。

やねうら王dev(WCSC29)は昨年の4月の時点でのStockfishから探索部をチューニングしたものであるから、そこから丸一年経過しているので、おそらく最新のStockfishの探索部を持ってきて、探索部をチューニングすれば、探索部があまりチューニングされていないmブランチよりは確実に強くなるだろう。『将棋神やねうら王2』には、その作業したものを収録しようと思う。

『将棋神やねうら王』と『将棋神やねうら王2』の差

『将棋神やねうら王』から やねうら王dev(WCSC29)でR110程度up、LargePage対応で+R20ぐらいup、2020年最新のStockfishの探索部+チューニングで+R50ぐらいup、最新の評価関数で+R50ぐらいで、R230程度のupとなると思われる。それを『将棋神やねうら王2』に収録する。前作より、(同じ思考時間で)1段ぐらい強くなる計算だ。

『将棋神やねうら王2』はいつ発売になるのか

まだ現状『将棋神やねうら王』のUpdate3の作業をしている。『将棋神やねうら王』を購入していただいた方に、満足いくものをまずはお届けしたいのでそちらが優先である。その作業自体はもうすぐそれは終わると思うが、それが終わってから、『将棋神やねうら王2』の開発に着手する。4,5ヶ月かかると思うので、発売時期は年末ぐらいになるかも知れない。発売を楽しみにされている方には、お待たせして申し訳ないが、そのような状況である。

やねうら王、mブランチとは何なのか?」への5件のフィードバック

  1. mブランチは最新のstockfishの探索部を有志がGithubやねうら王に反映したものである。
    だからR100ほど強い…

    なるほど…最新なら強いわな。天下のstockfishチームが弱いソースで更新しないからね!

    …て、いやいや、でもそのロジックというか工夫が知りたい…ような気が…できれば…

    • しかしLazySMPみたいな大物でなくて、説明不可能な細かいパラメータチューニングの組み合わせだと、それ以上説明しようもない…ですかね。

      それでも、現状でも、チェスのパラメータを将棋にそのまま持ってきて十分有効だというのは驚きのような気もしますが。中終盤の分岐は将棋のほうが多そうですし。

      チェスも将棋も静的局面評価がかなり正確になって傾向が似てきている?
      すると今後はもっと似てくる?

      • Stockfishのパラメーターそのまま将棋に持ってきてベストということはないですけども、そのまま持ってきてもそこそこ強いというのは興味深い性質ですね。

taka へ返信する コメントをキャンセル

メールアドレスが公開されることはありません。 が付いている欄は必須項目です