将棋ソフトの出力する評価値31111とは?

将棋ソフトの出力する評価値31111について、数年前にどこかに書き散らしたことはあるのですが、まとまった記事がなかったので解説します。

評価値31111 – よくある質問 (やねうら王Wikiより) :
https://github.com/yaneurao/YaneuraOu/wiki/%E3%82%88%E3%81%8F%E3%81%82%E3%82%8B%E8%B3%AA%E5%95%8F#%E8%A9%95%E4%BE%A1%E5%80%A431111

Q.

勝勢でもないのに評価値に31111という値が表示されることがあります。これは何ですか?

A.

やねうら王NNUEでは優等局面の内部的な評価値が28000となっています。これを出力する時に、cp(centi-pawnという単位)に変換します。cpは、歩1枚の価値が100なのですが、内部的な評価値は、歩1枚の価値は90になっていますので、優等局面の時に出力される値は、28000×100/90 cp = 31111 cp ということになります。

優等局面は、前の局面より悪くなることはありえないため、やねうら王では優等局面に遭遇した時点で、その進行はありえないものとして、評価値28000(詰みではないが、相手が回避するであろう評価値)をつけて、読みを打ち切っています。そのため、優等局面が含まれる変化があると、そこで評価値31111と出力されることがあります。

また、優等局面とは、以下の意味である。

優等局面 – よくある質問 (やねうら王Wikiより) : https://github.com/yaneurao/YaneuraOu/wiki/%E3%82%88%E3%81%8F%E3%81%82%E3%82%8B%E8%B3%AA%E5%95%8F#%E5%84%AA%E7%AD%89%E5%B1%80%E9%9D%A2

Q.

優等局面とは何ですか?

A.

盤面(盤上の駒配置)は同じなのに、自分の手駒が増えている局面です。

例えば、相手が歩を成り捨てたので同金と取って、また相手が金の頭に歩を打ってきたので、金をバックしたとします。そうすると歩を成り捨てる前と同じ盤面で、手駒が歩一枚増えていることになります。これを(前の局面に対する)優等局面と言います。

この逆に、盤面は同じで、自分の手駒が減っている局面は劣等局面と言います。

Wikipediaの「31111」に関する誤りについて

結論的には、31111というのは、28000×100/90という、やねうら王固有の値なのである。28000は、やねうら王独自(私が勝手に決めた定数)、歩の価値が内部的に90なのは、Aperyに倣ったためである。(当時、KPPT型の評価関数をAperyのソースコードから移植してくる時に、ここが90である必要があったため。)

このような事情なので、この評価値を偶然出力する他の将棋ソフトなんてものは存在しないのである。

だから、Wikipediaの将棋関係のページで以下のような記述があるが全部誤りな。31111を出力するのはやねうら王だけで、やねうら王の作者(私)が、この評価値は必至の値ではないと言っているのだから。

必至等「31111」

必至(あるいは一手一手の寄りの読み切り)を「31111」とするなど、評価値で即詰みと必至を区別している例もある。

必至や一手一手の寄り等の読み切りを「31111点」とする等の方法で即詰みと必至(あるいは一手一手の寄り)を区別している例もある)で表現されるほか

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です