やねうら王 WCSC30 PR文書

今年の5月に開催予定のWCSC30(第30回世界コンピュータ将棋選手権)、コロナのせいで中止になりそうなのに、PR文書の提出期限は3月末なので何か書いて提出しなければならない。

仕方がないので20分ぐらいで殴り書きしたPR文書を提出しておいた。以下にそのコピーを貼り付けておく。なお、内容の正確性については一切保証しない。

=== PR文書ここから ===

やねうら王は、前回(WCSC29)、テラショック定跡という、定跡の末端局面に評価値をつけ、定跡ツリー全体をmin-max探索のようなことをして、定跡を生成する手法を採用した。

やねうら王の場合、この末端局面で評価値をつけるときにそこそこ深いdepthで探索させていたし(depth = 34以上)、末端局面までの手数(ply)もほぼ一定であったので、さほど問題は表面化しなかったのだが、部分的に深くまで定跡を掘る(plyがまばら)である場合や、末端局面での探索のdepthが浅い場合には次のような問題が起きることがわかってきた。

あまり定跡が掘れていないplyが浅い局面のほうがたまたま少しだけ高い評価値がついていることがあるので、定跡が深くまで掘れている局面よりは、浅いほうの局面に誘導するような定跡が生成されてしまうことがある。

例えば、後手の定跡について考えてみると、将棋では先手の勝率が55%(引き分けの対局は除く)程度なので、定跡を深く掘れば掘るほど末端局面で後手が不利な局面に到達しやすく、その結果、後手はplyの浅い、互角に近い局面のほうに誘導するような定跡となってしまう。

これは好ましいとは言えないので、末端の評価値に対してplyに応じた何らかの補正を行う必要がある。これについて以下のように定式化を行い、末端の評価値の補正をした上でmin-maxにより、定跡を生成することにした。

先手が勝ちの対局において、plyにおける期待勝率は、終局に向かって直線的に増加すると仮定できる。1局の平均的な手数が160として、ply ≦ 160とする。

先手から見た、先手勝ちの対局の平均期待勝率(ply) = 50% + ply/160*50% // (ply)は、plyの関数と言う意味

同様に後手からすると後手勝ちの対局の平均期待勝率(ply)(先手から見た期待勝率) = 50% – ply/160*50%

とか書けて、仮に、先手の勝率期待値が55%だとすると、前者が55%、後者が45%で生起するので

平均期待勝率(ply) = (50% + ply/16050%)55% + (50% – ply/16050%)45%
= 50% + ply/16050%10%
= 50% + ply/160*5%

つまり、終局までの手数をm、先手の期待勝率をrとすると、
平均期待勝率(ply) = 50% + min(ply,m)/m * ((r-50%)/2)
となる。

これで末端局面の評価値を補正する。

勝率と評価値の変換式を用いて、
 勝率 = 1 / (1 + exp(-評価値/600))
評価値の補正値(ply) = (略)

これで補正するので leaf_node_eval = 探索で得た評価値 – 評価値の補正値(ply)

=== PR文書ここまで ===

ちなみに、WCSC30は開催されたとしても、やねうら王は欠場するかも知れない。高い確率で中止になりそうなところに全力でコミットするだけのモチベーションが保てないんだ。

やねうら王 WCSC30 PR文書」への21件のフィードバック

  1. 話題の関連性はありませんが、やねうら王のバイナリをclangでコンパイルしたものがNPSが良いので公開している方がいますが、私の計測でもclangはNPSがやや出ており短時間では確かに少し強いのを確認していますが、以下2つの疑問点を教えて下さい。
    1. やねさんもコンパイルしたものの方が数億ノードでも同じようにやや強いと思われますか?
    2. clangでコンパイルしたものが良いのであれば最初からclang版をなぜ標準として公開されないのでしょうか?

  2. ファンとしては残念だけど、無理して開催することでもないし、普通に考えて中止だもんね。コロナがなかったとしてもモチベーションが上がりそうもないやねさんにとって絶好の口実ができちゃったね。

  3. やねうら王アピール文書難しい・・・
    アピール文書そろってますね。やねさんはどのアピール文書に注目ですか?
    WCSC30が中止になっても有志によって「非公式コンピュータ将棋大会 in floodgate」とかしそうだ。

  4. コロナで暇なので、なんかしらやねさんに魅力的なもん公開してほさもらえたらなーなんて チラッチラッ

  5. 正直やねうらおさんが本気出したらワクチンとか特効薬とかさらっと開発できるんじゃないかと思ってます。

  6. GWは家に張り付くことになりそうだから、ウィルス感染させない娯楽は積極的にやってほしいところです。floodgateで戦い、解説もみんなのおうちからニコニコで。レギュレーションはいつもと違っても、僕ら見ている方にとっては問題ないです。熱い戦いが見たい。感動したい。

    • スポンサーと、やる気のある人たちが集まればオンライン対局〜実況・解説〜いくばくかの賞金ぐらいは可能だと思うんですけど、私はやる気のある人達のグループに入っていません..

  7. オンライン開催の予定は ございません。って書いてるのに「世界コンピュータ将棋オンライン大会」を実施するってどういう意味?非公式ってこと?

    • (一部のスタッフが協力はするから)非公式で勝手にやってクレクレってことでしょう。
      なお、優勝者に賞状と盾は優勝者が希望すれば私が勝手に用意して送る予定。

  8. やねさん優勝された29回大会、今回中止となった30回大会のやねうら王って公開の可能性ってありますか?

  9. やねうら王2018は評価関数としてはどのくらいの棋力なのでしょう?
    興味があります。
    こちらのコメント欄をみていると、新しいのがでると書いてあり、大会優勝版も入るとのことでせっかくなので2の発売まで待とうと思うのですが、以前のやねうら王2018などの評価関数は今後フリーででてくることはありますか?

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です