AlphaZero系の将棋ソフトは、評価関数の表現力が極めて高いので、序盤周辺の局面を学習する力が従来の将棋ソフトとは桁違いです。
平手の初期局面から勝ちやすい指し手を覚えてしまっていると言っても過言ではないです。定跡なしで戦わせると特にその傾向が顕著です。
AlhaZero系のソフトである、AobaZeroは、「やねうら王の互角局面集」だとR150ほど下がるそうです。自分が進行する序盤の戦型(居飛車の特定の形?)のみを、高い序盤の学習能力でもって強烈に学習している感じはします。
互角局面集を使うとAobaZeroは +150 ELOほど弱くなる 投稿者:山下 投稿日:2020年 9月18日(金)19時25分46秒 編集済
AobaZeroは対Kristallweizenとの棋力計測に磯崎氏が作成された互角局面集を使っています。
これを使わずに「やねうら王 標準定跡」を相手側だけつかうようにするとAobaZero w1650の1手800 playoutはKristallweizen 1手500k 相手だと +114 ELO 強く、elmo 1手346k 相手だと +155 ELO 強くなります。
これは互角局面集にAobaZeroが指さない戦型(穴熊や先手振飛車、対振で船囲いから急戦など)が含まれてるためと思われます。
AobaZero(w1650)の1手800playout 対 Kristallweizen、elmoで互角局面集、standard_book.dbを使った場合。
AobaZeroは一切乱数性なし。
Kristallweizen 1手500k 勝 分 敗 局数 (宣 千 宣) 先手勝率 勝率 95% ELO互角局面集 348-22-430 800 (183-14-4)(397-381,0.510), 0.449(0.034)( -35)
standard_book.db, 同一棋譜 3局, 482-15-303 800 (268- 9-1)(401-384,0.511), 0.612(0.033)( 79) +114差
elmo 1手346k
互角局面集 580-11-209 800 (338- 9-0)(412-377,0.522), 0.732(0.030)( 174)standard_book.db, 同一棋譜 5局, 693- 5-102 800 (423- 3-2)(403-392,0.507), 0.869(0.023)( 329) +155差
※1 standard_book.db は v4.73_book の「standard_book.zip : やねうら王 標準定跡」
※2 elmoは「elmo WCSC25版」に付属の standard_book.db を使うと800局で同一棋譜が5局から75局に増えます。
AobaZero側で最初30手までは勝率2%以内ならsoftmax samplingで選ぶようにすると75局が5局程度に減ります。
最終的な勝率も0.879程度とあまり変わらないです。
自己対局用に互角の局面集を公開しましたhttp://yaneuraou.yaneu.com/2016/08/24/…
やねうら王 定跡ファイル詰め合わせhttps://github.com/yaneurao/YaneuraOu/releases/tag/v4.73_book
コンピュータ将棋や囲碁の掲示板 : https://524.teacup.com/yss/bbs/
やねうら王プロジェクトで公開している互角局面集は、プロの棋譜の24手目で当時のやねうら王で探索させて、評価値が互角に近かった局面から抽出していたので、対抗形(居飛車 VS 振り飛車)もかなりの割合で含まれているはずです。
しかしコンピューター将棋の世界では、振り飛車は損とされており、上位の将棋ソフトではなかなか自発的に振り飛車を指すことはありません。(振り飛車好きの評価関数や、振り飛車の定跡を持っているならば話は別ですが)
そういう意味では、やねうら王の互角局面集は、プロの将棋に現れるような局面での強さ、オールラウンダーとしての強さ、みたいなのを計測するベンチマークにはなるのですが、将棋ソフト自体の強さを計測するベンチマークとしては、あまり適切ではない意味があります。
そこで、水匠の開発者であるたややんさん(tayayan_ts)は次のような互角局面集を作成されました。
・floodgate2019~2020でR3800以上同士の対局のみ
・36手目までの定跡
・36手目の局面まで、全ての指し手について評価値が±100以内となっている対局のみを抽出。
・24手目の時点で、手順が重複するものは排除
「ソフト的に見て互角」なので、対抗形は必然的に含まれません。コンピューター同士の戦いにおいて、極めて頻度の高そうな局面集と言えるでしょう。しかも、36手目までの局面がすべて互角であることが保証されているので、この互角局面集の12手目から対局させた時はどうか?24手目からならどうか?みたいな計測ができるということです。素晴らしい!
今回は、この互角局面集をたややんさんのご厚意により、このブログで公開できる運びとなりました。皆さん、是非、活用してみてください。
たややん互角局面集(36.sfen) :
https://drive.google.com/file/d/1-gUxwl6XTIiw-amsNAsJSUmjluxU28kF/view?usp=sharing
コンピュータ将棋の互角局面といえばtttakさんの局面集(https://github.com/tttak/ShogiGokakuKyokumen/tree/master/2019%E5%B9%B4/floodgate2019%EF%BC%88R3900%E4%BB%A5%E4%B8%8A%EF%BC%89)
も高レート帯プレーヤーの棋譜から抽出されてるみたいで、うまく使い分けると捗りそうな予感がします。
「高レートのソフトから見て互角」の局面集は、戦型的にすごく偏ってそうで、角換わり/矢倉
/相掛かり以外の将棋があるのか気になるので見てみようと思います。
tttakさんのは、N手目で互角なだけなので、その点がやや使いにくいんですよね。
「『全て』の指し手について」という点を見落としてました、これは画期的な局面集ですね!
今までほとんどの局面集はN手目時点での評価しかみてないので途中からスタートして際の互角は保証されてませんでしたし、類似のまふ互角局面と比べて計算資源、評価関数精度が遥かに違うのも使いやすそうです。(強いていえばネックなのは局面数が2000ぐらいしかない事ぐらい?)