定跡の生成に使った評価関数を用いるべき?

定跡の生成のため探索をして評価値が一定以上悪くなる指し手は定跡DBには登録しないだとか、探索して棋譜の指し手の評価値を定跡DBに記録しておき、ベストの評価値とかけ離れた評価値の指し手は採用しないだとかして定跡DBを作っていたのですが、少し興味深い現象があったので書いておきます。


同じぐらいのprediction(棋譜との指し手一致率)を持つ、同程度の棋力のはずの評価関数パラメーターが二つあったので連続自己対戦で勝率を見ていたのですが、定跡を作るのに使ったほうの評価関数パラメーターを採用したほうが優位に勝ち越すのです。

自分の大局観に合った定跡だからということなのでしょうか?

別の理由としては、定跡を生成するのに使ったソフトだけが有利になる変化を見つけられていて(だからその定跡DBの指し手に高い点数をつけている)、他のソフトでその局面から指させても有利な変化を見つけられず、そのあと互角か不利になってしまうということもあるのかも知れません。

人間でも、自分の棋風に合わない戦型は辛いので、コンピューターにもそういうのがあるのかなぁと。


定跡の生成に使った評価関数を用いるべき?” への1件のコメント

  1. 興味深い話だと思います。
    「結果的に深く読んでいるんで強い」という可能性があるような気がするので、そうなると(手の延長みたいな部分による)絞り込んだ局面の実現確率が高まるとかなのでしょうか?

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です