魔女をめぐる冒険その3

いくつかの面白い実験結果を書いておこう。

魔女+Aperyの最新の評価関数(20160916) vs 技巧。
定跡で24手まで進めての対局。

4スレッド3秒だと魔女側+R40程度(2000局)
4スレッド6秒だと魔女側+R60程度(2000局)
4スレッド10秒だと魔女側+R75程度(1000局)

どうも、長い持ち時間になるほど技巧との差は乖離していくようなのだ。

電王トーナメント本番は、予選でも15分10秒であるから、1手当たり15秒ぐらいは使えるはずで、しかも、4コア8スレッドなので、(CPUの差も考慮すると)上記の実験の4スレッド10秒の4倍ぐらいに相当する。

そうすると、たぶん魔女は、技巧+R120ぐらいのところに位置するものと思われる。

長い持ち時間でのチューニングは計算資源の都合、どのチームも十分に出来ているとは言い難いが、わずかなチューニングの差が長い持ち時間では大きな勝率の差となって現れるということは十分ありそうだ。

魔女をめぐる冒険その3」への11件のフィードバック

  1. >たぶん魔女は、技巧+R120ぐらいのところに位置するものと思われる。
    技巧が今回の電王トーナメントで進化している可能性もあるのでそうは言えないかと思います。

    個人的には技巧を応援したい。
    あとやねうら王も応援してます。

    • 今年の電王トーナメントに出てくる技巧については全くの未知数です。本文中に書いた技巧とは、現在公開されている技巧のことです。

  2. 私の環境では、対技巧ではありませんが、定跡OFFの8スレッド30秒ですと
    同評価関数でSMよりもやねうら王3.57のほうが強かったですよ。

    100局しかやっていませんので統計的には信頼度中ですが。

    内容を見ていますと、SMのほうが中盤以降Depth2~3くらい上回っていましたが、
    深く読み過ぎ?て、そのときの探査で出た攻めが成立すると自ら細いルートに入って行った結果、攻め切れして逆転負けとか結構ありました。

    細かく言えばSMが攻める。やねうら王が守るという構図になると、ほぼ守りの探査に偏るのがいいのか必要なノード数が減り、Depthの差が無くなるみたいな感じでした。
    そして、将棋は攻め始めて一方的に詰ませるような単純な物ではないので、攻め切れした常態が玉を逃がした形なのか、大量の持ち駒を与えた状態で攻守が変わってしまった形なのか違いはありますが、評価値1000くらいなら逆転してしまうような状態でした。

    • 上記の話はこれからみなのかなぁ?

      > その結果、魔女ではいくつかの枝刈りがコメントアウトされている。

    • 後手の持駒:角 金二 歩二
      9 8 7 6 5 4 3 2 1
      +—————————+
      | ・v桂 ・ ・ 龍 ・ ・v桂v香|一
      | ・ ・v玉 ・ ・ ・ ・ ・ ・|二
      | ・v歩v歩 ・v歩 ・v銀v歩v歩|三
      | ・ ・ ・ ・ ・ ・v歩 ・ ・|四
      |v香v桂 歩v歩 ・v歩 ・ 歩 ・|五
      | ・ ・ ・ ・ ・ ・ ・ ・ ・|六
      |v杏 歩 銀 金 ・ 歩 歩 ・ 歩|七
      | 歩 ・ ・ ・ ・ ・ ・ 飛 ・|八
      | 玉 銀 ・v馬 ・ ・ ・ 桂 香|九
      +—————————+
      先手の持駒:金 銀 歩
      後手番

      SMが先手良しとして突っ込んだ結果、後手やねうら王に受けきられて逆襲された例。
      ちょっと面白いのがこの局面、1億ノードくらい読むと先手がプラス評価とか出るんですよ。
      なのでSMは2~3手前まで自分がイケてると思ってたんでしょうね。
      人間の目から見れば、後手玉に詰みなんて無いんだから、そのまま9八成香とか7九金打ちで勝勢なのは一目見て分かる。

      • 詰みがあるかどうかの判断は、KPP型だと利きの数がないので誤った評価値になることがよくありますね。かと言って利きの更新はそこそこ重いのでなかなか評価関数に取り入れられないですね…。

        やねうら王も来年は利きを使った評価関数の研究、がんばります…(´ω`)

      • SMは攻め好きの「棋風」なのでしょうか?「棋風」=評価関数をイメージしていて探索は「深く読む技術」だけだから「棋風」には関わらないイメージだったのですが、そんな単純じゃないのですね。

        • 「棋風」=評価関数につては私も同意です。
          Apery新評価関数は0824ver以降は玉の安全度について評価値が100程度変わっており、定跡OFFにしても序盤は駒を引き付ける傾向にあります。この辺が技巧に対して高い勝率となる最も大きな原因だと考えています。
          しかし終盤はこれが邪魔して過剰に守ろうとした結果、攻めたら勝てるのに守って互角になったりします。この辺の終盤感覚は技巧のほうがだいぶ上です。

          探査についてはDepth18~22はほとんど差し手は変わることは無く、細かい評価値の変動がある程度ですが、Depth23を超えた手で評価値の良い差し手を発見したときはだいたいそれが勝負手になっています。
          なぜDepth23なのかは分かりません。これは2駒の技巧にも該当するので、81マスの盤内で様々な偶然が重なった結果だと思います。
          もちろん凡手を積み重ね、妙手を発動させないような将棋のほうが多いので、最強を目指す人やソフトだけ気にすればいいかと思います。
          よって私はDepth18を下回る自己対局に何の価値も無いと思っています。

          「棋風」=探査なのかについては、今やっている第57期王位戦七番勝負 第6局を例にすると、羽生さんがやった角交換右玉について、同じ評価関数を使ってみると
          SMは自力打開出来ません。相手の戦型のバランス(評価値)が良く、自分から動くと評価値が落ちるので千日手っぽい動きをします。
          やねうら王は見たこともない戦法でどちらにも勝ち筋がある力戦をやります。

りちゃ へ返信する コメントをキャンセル

メールアドレスが公開されることはありません。 が付いている欄は必須項目です