電王トーナメントの強豪ソフトのアピール文書にツッコミ

投稿日時: 2015年11月16日投稿者: やねうらお

今回の将棋電王トーナメントのアピール文書が公開されました。(遅すぎ！)

将棋電王トーナメント出場ソフト
http://info.nicovideo.jp/denou/tournament2015/soft.html

気になった強豪ソフトのアピール文書にざっとコメントを。

Ponanza

目新しいことが書かれていません。秘密主義？

大樹の枝(Apery)

最近気付いたんですが、僕がいくら改良しても、それを GitHub で公開してたら Apery ライブラリ使う人のソフトまで勝手に強くなってしまうので、差が付かない！という事で GitHub への push は大会終わるまではサボり気味にしておこうかなーとか思ってます。仕方ないよね。僕も勝ちたいです！

このくだり、ほんと好き。GitHubへのpush、1年遅れでもいいんじゃないでしょうか。それでも1年前の自分に大差で勝たなければならないという足かせはあるわけで…。

tanuki-

AVX2 拡張命令の VPGATHERDD 命令を用いた盤面評価関数ルーチンのベクトル化
” ベクトル化しない場合に加え 3%程度速くなりました

VPGATHERDD！？ああ、KPP配列をkpp[sq][p1][p2]だとしたら、kpp[sq][p1]のアドレスをbaseとして指定して、8つずつ要素をまとめて取ってくるということなのでしょうか。評価関数って、メモリ帯域がボトルネックになっているから、どうせ速くならないと思ってたけど、そうでもないのね…。これはミラクル！

nozomi

• KPP = 絶対KPP + 相対KPP + 絶対PP + 相対PP
• KKP = 絶対KKP + 相対KKP + 絶対KP + 相対KP + 絶対KK + 相対KK
• KP要素についてはKPPとKKPで同じ値を使用するようにしています

相対KKなんて回転対称だから値がつくべきではないので入れないほうがいいです。ノイズになります。(手番を考慮するなら別) あと絶対KK、KKPに次元下げのときに入れてしまうと、FV38をやっているとして1回のevaluateで必ず同じ要素が38回出現することになるのでボナメソで値を2動かそうとしたときに、38*2 = 76も動いてしまいます。ゆえに、絶対KKをKKPの次元下げに含めるのはしないほうがいいです。同じ理屈で、KP要素もKPPとKKPに同じものを含めると値が二倍変動してしまうので、KKPのほうにだけでいいです。

大将軍

しかし、大会 PC のスペック変更により、搭載メモリが 32GB と減ったため、4 駒の評価関数をメモリ上に展開することができなくなりました。
このため、4 駒の評価関数の採用は断念し、3 駒の評価関数を今大会用に一から学習を開始し、出場することとしました。

お気の毒に…。本当、電王トーナメントの開催スケジュール、ルールやPCスペックの発表が遅れると開発のほうは色々振り回されますよね…。

技巧

初参加で強さは未知数ですが、私はこのソフト、相当強いと思います。

各マスの利き数の計算をSIMD演算により高速化
・１マスにつき１〜２バイトのデータ構造（byteboard / wordboard）
・ SSEを使った場合、最大１６マスの利き数をいっぺんに計算でき
るので、１マスずつ処理するのに比べて高速に計算可能です。

利きの数、1升1byte(先後で2byte)確保しておいて、SSEでまとめて加算してしまうのはまあ、利きの数を必要とする評価関数であれば、最近はそうしますよね。利きの数を用いる評価関数を使ってるの、KPP/KKP勢にはいないと思いますが、私は今後主流になる可能性があると思っています。

ちなみに1升の利きの数は最大で4bitで収まるのでsoftware packed bitとみなして加算/減算すれば、盤面更新の効率は上がります。AVX512が使えれば、4bit*81升の利きの更新が1回の更新で済むので…。(そのあと利きのある升を取り出すのに苦労するかも知れないので良し悪しではありますが。)

利き情報をsoftware packed bitのMSBに集めるためには1升5bitにして5bit*81升(512bitに収まる！)みたいにするのがベストだと思いますけども。software packed addについては、以下の記事をどうぞ。

縦型Bitboardの唯一の弱点を克服する

あと各升での利きの優劣も、software bit演算のテクニックを使えば(1升が)5bitであれば簡単に出来ますね。引き算で引かれる側のMSBを事前に1にしておけば、負の数になったときにMSBが0になりますので…。

まあ、利きを評価関数に取り入れている強豪ソフトって一握りだけなので、いまこの話を延々と書いても、ほとんどの開発者にとって「だから何？」ぐらいの話だと思いますが、あと5年か10年後には「やねうらおさんは先見の明があった！」「利きを5bitで持つのがベストであることを2015年の時点で予言していたとか、マジで天才！」と言われるはず。(笑)

習甦

Bonanza型の3駒関係を導入したらしいです。非線形な評価関数を導入しているのは習甦ぐらいのものなのでそういう意味では注目株なのですが、非線形な評価関数で本当に強くなるかは実際のところ立証はされていなくて…。

Selene

PR文書のリンク間違っていて見れないです。(2015/11/16 19:55現在)
http://info.nicovideo.jp/denou/tournament2015/img/PR/Selene.pdf
が正しいようです。

指し⼿の評価が他の指し⼿と⽐べて極端に⾼い指し⼿については、探索深さを深くして学習を⾏っています。

これ、わりと面白いアイデアですね。

まとめ

今回棋力だけで言えば、
Ponanza > Apery ≒ 大合神クジラちゃん ≧ tanuki- ≧ nozomi ≒ Apery(WCSC25) ←R100〜150の差→ 昨年のApery
ぐらいの感じだと思います。

あと技巧は上図のAperyからnozomiの間には来るはず。

超やねうら王はまだ開発中なのでよくわかりません。Apery(WCSC25)よりは上に来るようにいま頑張っていますが、新しい評価関数、そもそも昨年のものより弱い可能性も…。

追記

クジラちゃん、探索部がAperyからではなく、なのはminiベースなのでApery(WCSC25)ほどは強くなってないそうです。Apery(WCSC25)の探索部に調整面、速度面等で負けているんですかね。興味深いです。