やねうら王ライブラリのNetworkDelayオプションについて

やねうら王の持ち時間制御、わりと複雑で、例えば、0.6秒で思考が終わっても繰り上げて1.0秒になるまでは思考を続けるようになっている。自己対戦によるとこのほうが勝率が上がるからである。

この直前にPVの初手が変化するとその先の部分木について読みが足りないことがある。将棋ソフトの開発者ならご存知の通り、PVとnonPVとで読みの量が桁違いに異なるからである。たまに大悪手を指してしまう可能性がなくはない。しかしまあ、Stockfishもそうなってるし、こちらのほうが強いはずなので、とりあえずそれは良しとしよう。

問題は、ネットワークの遅延時間があるということである。1.0秒に思考が完了し、指し手を送ったのでは、1.1秒とかになって、繰り上げ計測で2秒消費したことになってしまう。そこで、1.0秒より早めに指さないといけない。これは、やねうら王のNetworkDelayというオプションで指定する。

NetworkDelayの値は120(0.12秒)がデフォルトになっている。会場での遅延具合を見て、この値はもう少し大きめにしたほうが良いかも知れない。

しかし、この値はあまり大きめにしないほうが得ではある。というのも、ネットワークはいつも大きく遅延するわけではないし、10回に1回オーバーして1秒損しても、平均的には小さめの値にしておくほうがトータルでは得だからだ。

そうは言っても切れ負けになる瞬間だけは大きくマージンを取るべきである。これがNetworkDelay2である。デフォルトでは1120(1.12秒)にしてある。少し大きい気がしなくもないので各自調整して欲しい。

ところで、それとは別に、将棋ソフトにはponderという仕組みがある。相手の手番のときに思考していた指し手が当たることを「ponderがhitする」と言う。

持ち時間制御では、

A) ponderがhitしたとき
B) ponderがhitしなかったとき

のそれぞれの処理が必要になる。

また、今回の電王トーナメントでは15分+1手10秒である。持ち時間が残り30秒という状況でも、1手10秒はあるので、これは40秒である。このときの計算がバグっていないとも限らない。

さらに、ponderが絡んで、持ち時間がなくなる瞬間との組み合わせに何らかバグがあると切れ負けになってしまう。ここにNetworkDelayが絡むとさらに複合的に生じるバグがあるかも知れない。256手目ルールで256手目の使用時間の計算にバグがあって256手目で切れ負けになるかも知れない。ともかく、このへん、とてもややこしい処理であることは伝わったかと思う。

正直、やねうら王では十全なテストは出来ていない。以前、将棋所でponderと切れ負けをONにして数百局、正常に対局出来ることは確認したが、その程度である。何かバグがあれば許して欲しい。(というか早めに教えて欲しい)

私は、当日、切れ負けしたら、NetworkDelay2を2200ぐらいに変更して対局しようかと思っている。ついでにMaxMoveToDraw(引き分けまでの手数)を安全を見て256ではなく258にしたほうがいいんじゃないかとも思っている。

ともかく、電王トーナメント2日目は2時間切れ負けなので、このへんのややこしい問題はずいぶん緩和されるはずではあるが…。やねうら王ライブラリ使用チームが、やねうら王に起因するバグを踏まないことを祈っている。

「やねうら王ライブラリのNetworkDelayオプションについて」への6件のフィードバック

時間制御、これ重要ですよね。

私が調べたときは、最も正確なのは技巧でした。ＳＭはかなりルーズでプラスマイナス０．１秒も誤差がありました。
ＳＭのこのレベルの誤差でも指し手１秒対局では正確なＲを測れないくらいの誤差が出ました。
試行錯誤した結果、最終的にdepth１８～２２は指し手がほとんど変わらない点に着目し、
４コア８スレッド、指し手２秒、３００局が最も最短で信頼値を得られるという結論になりました。

前記事で「出村さんがPR文書を更新していないことからも、お忙しいのかなと思いまして」とありましたが、
今回のPR文書内の「自己対戦のプロセスをRubyで自動化」「前のバージョンと3000局程度対局」とあったので、
指し手秒数が書いてありませんでしたが、技巧レベルの時間制御なら０．２秒の３０００局とかで信頼値が得られるのかな？と勝手に想像してました。
２駒の限界が何処か分かりませんが、現verより相当に穴埋めされているんじゃないかと思います。

ただ２駒はどうしても３駒に比べ駒の連結があまいので、ソコを攻められて上手くさばけるかが技巧の見所かなと勝手に思っています。

返信 ↓

やねうらお 2016年10月5日 17:35 より:

> ＳＭのこのレベルの誤差でも指し手１秒対局では正確なＲを測れないくらいの誤差が出ました。

search.cppのほうに4096という定数があって、4096 nodes(局面)読むごとに今回の使用予定時間になっていないかをチェックするのですが、遅いマシンだと4096 node読むのにかかるのが0.02秒ぐらいぐらいあって(つまり0.02秒ごとにチェックしていることになります)、これによる誤差とかもあったりするかも知れないです。あとは、入出力の誤差とか、使っているタイマーのAPIの違い等…。時間を正確にするのもなかなか大変ですね…(´ω｀)

返信 ↓