Apery(SDT5)の評価関数はどれくらい強いのですか?

本大会で最強の評価関数はAperyのものだと私はくどいほど言い続けたが、それを確認しておく。

KPPT型のrezero19。これがelmo+R170ぐらい。(長い時間だともう少し強いかも)
これと対局させてみた。今回から、1スレッド=1物理スレッド(1論理スレッドではない)で計測する。論理スレッド分だけスレッドを作成した場合(80HT×2(先後) = 160論理スレッド作成した場合)、コンソールが詰まったりして、多少誤差が乗るので物理スレッドのほうが計測が安定するようである。あと開始局面として、やねうら王の互角局面集を用いている。

engine1 = YaneuraOuGoku_KPPT_learn.exe , eval = rezero_kppt_epoch19
engine2 = YaneuraOuGoku_KPPT_learn.exe , eval = Apery20171111
T1,b1000,432 – 14 – 554(43.81% R-43.21) win black : white = 51.62% : 48.38%
T1,b2000,425 – 14 – 561(43.1% R-48.23) win black : white = 48.17% : 51.83%
T1,b4000,444 – 14 – 542(45.03% R-34.65) win black : white = 50.41% : 49.59%

rezero19+R40前後と言ったところのようである。今回優勝したぽんぽこもrezero19と同じぐらいの強さのはずなので、ぽんぽこより強いと言えそうだ。

rezero19は教師局面をdepth 10で110億局面作って学習させてある。Aperyはdepth 8で教師局面を作っているらしく、何故、この差が出てくるのかはいまのところよくわかっていない。おそらく、やねうら王のほうの教師局面の作り方に問題があるのだろうが…。(やねうら王は平手の初期局面からランダムムーブ20手をさせた局面を開始局面としている。) この調査のために追加でどれだけの計算資源が必要になるか想像もつかない。いやはや、大変な宿題が残ってしまったものだ…。

なお、このAperyの評価関数、やねうら王(KPPT型)で使えるように変換したファイルは以下のところからダウンロード出来ます。平岡さん、ありかとう!

Apery(SDT5)の評価関数はどれくらい強いのですか?」への5件のフィードバック

  1. 更新お疲れ様です。

    11/20時点でuuunuuunさんのサイトでAperyがR4138、ぽんぽこがR4097なので、やねさんの測定結果は妥当な結果に思えます。

    ところで、「本大会で最強の評価関数はApery」とのことですが、Ponanzaと比べてもAperyの方が強く感じられましたでしょうか?
    観戦している限りではPonanzaの方が強く感じましたので、質問させて頂きました。

    • 公開する以上、WCSCで使えるライブラリに登録しようかと思うんですけど、そうするとそこがWCSCの予選通過ラインになったりして大会に結構影響が出るので、もう少し様子を見てから公開するか考えます。

      • 確かに sdt5でも人造棋士18号が予選落ちたりしてましたもんね。
        rezero19が公開されたら、そのブレンドとかで、4150が予選突破ラインになったりして…

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です