Aperyの評価関数がどんどんバージョンアップしている。
しかし、私のほうではこれが強くなっていることを検知できないレベルにまで来ている。
定跡を切ると技巧に勝てる?対局数が増えて300弱。魔女 191-3-99 技巧 (R差114), やね181-3-96 技巧 (R差110) 技巧に対する勝率は拮抗してきた。やねと魔女は互角だったので相性問題が解決している。魔女もやねも定跡を切るのが技巧に対してはよいようだ。
— uuunuuun (@uuunuuun1) September 13, 2016
持ち時間を1秒から5秒にしたときにレートが大幅に変動しうるというのは開発者の人にとってはインパクトがあると思うけど、どうやったら長時間で強くなるのでしょうね。
— uuunuuun (@uuunuuun1) September 17, 2016
私は自己対戦(やねうら王 vs 技巧もこれに含む)のときに、やねうら大定跡から生成した形勢互角の局面まで定跡の指し手として24目まで進めている。ところがこれをすると序盤の棋力改善の結果がわからない。
特に技巧は2駒関係+利きなので序盤の形について、3駒関係ほどは学習がうまく出来ていないようで、初手付近でいきなり定跡から外れるとかなり勝率が下がるという弱点を抱えているようだ。
結局、定跡をオフにするだとか、やねうら大定跡を用いるだとか(これは確実に技巧の定跡からは外れる)すると、対技巧の勝率は上がるようである。
やねうら王を用いた自己対戦で計測していると、Aperyの評価関数はバージョンが新しくなるにつれ、序盤は改善されているが終盤は互角か、わずかに弱くなっていることもある。確かに対技巧の勝率は上がるのだが、これは他のソフトに対しても強くなっていると言えるのかどうかよくわからない。定跡手順で16~24手目ぐらいまで進んでしまうなら、以前の評価関数ファイルのときと大差ないように思う。
他のソフトが搭載しているような定跡手順では決して進まないように、やねうら大定跡やPonanza定跡のような、他のソフトの搭載している定跡を外すための定跡を搭載すべき段階に来ているのかも知れない。
ともかく、以上のような理由により8手目ぐらいまでの互角の局面を1万局面ぐらいかき集めないと自己対戦もままならないのだが、その局面を用意するのも案外大変である。もう今年の電王トーナメント、やねうら王は駄目かも知れん…。
序盤の理想的な評価関数と
中盤のそれはビミョウに違うのか
そこは共通の評価関数でいくしかないのかな
序盤と中盤と終盤とで評価関数を内部的に切り替えられるといいんですけどね。GUI側から新しい局面が与えられた時点で切り替えるのは難しくないんですけど、探索の途中で切り替えるのは差分計算が出来なくなってしまうので現実的ではないですし、そして学習に要するコストは3倍になりますし…。
相手の序盤の動きからソフトの種類を特定し、こちらの手を変えていくとか、それなんてウイルス v.s. ウイルススキャナ的なノリですかみたいなw
YSS全盛期のWCSCでは対戦相手を見て序盤の定跡を変えるというのが流行っていたように思います。私も電王トーナメントでは毎回それをやっていますが。
技巧の定跡をまともな物に入れ替え、居飛車ばかり指すと新評価関数の定跡ON、OFFでも勝率はほぼ同じになります。
ですから、定跡を意図的に外すみたいな所に労力を使うのは時間の無駄のような気がします。
新評価関数の評価について、私はAperyの評価関数が変わるたびに将棋ソフトが判断を間違いやすいサンプル局面を数局用意して、同Depthでどんな評価を出すか比較して判断しています。
ちなみに0911と0917は間違って同じ物を貼り付けたのかと思ったほど変わっていません。
> 技巧の定跡をまともな物に入れ替え、居飛車ばかり指すと新評価関数の定跡ON、OFFでも勝率はほぼ同じになります。
ほほー。面白いですね。技巧のいま搭載されている定跡が、少し甘いのかも知れませんね。出村さん、「公開用の技巧は、一般ユーザーに楽しんでもらうために、(大会用より)少し広い定跡にする」という趣旨のことをおっしゃっていましたし。