技巧2とやねうら王+リゼロ評価関数epoch7ではどちらが強いのでしょうか?
対局させた人によるとやねうら王が勝ち越したそうです。
リゼロ評価関数epoch 7の時点ですでに技巧2より強いとは…。
しかし、そうなってくると電王トーナメントまでにepoch 8以降、どこまで公開していいか悩むなぁ…。 https://t.co/3ZrVpEcjoZ
— やねうら王 (@yaneuraou) June 16, 2017
別の実験として、私の手元でelmo(WCSC27)とやらせてみたところ、2スレ1秒、2秒では以下のような結果になりました。
engine1 = YaneuraOuV460.exe , eval = eval_zero_epoch7
engine2 = YaneuraOuV460.exe , eval = elmo_WCSC27
T2,b1000,366 – 13 – 621(37.08% R-91.84) win black : white = 51.06% : 48.94% T2,b2000,374 – 14 – 612(37.93% R-85.55) win black : white = 51.01% : 48.99%
R90ほどの差のようです。elmo(WCSC27)は、浮かむ瀬とやらせると、長い持ち時間だと勝率が開いていきます。リゼロ評価関数も恐らくこの性質があって、elmo以前のソフトと長い持ち時間でやらせるとそうなるのかも知れません。
また、elmo絞りをした評価関数は、elmo(WCSC27)とやらせた場合、長い持ち時間でも勝率はほとんど変わらないことを事前実験で確認しています。(1スレ2,4,8,16秒においてそれぞれ5000,3000,2000,1000局対局させて確認) そこで、ここではelmo絞りをしたソフト同士の場合、2スレ1秒と2秒で計測しています。
以上のことから、リゼロ評価関数epoch 7は純粋に、elmo(WCSC27) – R90ぐらいの棋力があると言えそうです。uuunuuunさんのサイトによるとelmo(WCSC27)は現在R3965なので、R3875程度あるということのようです。
同サイトにおいて技巧2は現在R3792なので、まあ、epoch7が勝ち越すのも道理かなと言う感じです。また、Qhapaq(WCSC27)が現在R3862なので、epoch7とほぼ同等ということのようですね。