WCSC31(第31回世界コンピュータ将棋選手権)でDL(Deep Learning)系の将棋ソフトとして2位に輝いたPALですが、その新しいPR文書が公開されました。新しい情報が色々書かれているので、簡単に紹介しておきます。
PAL : https://www.apply.computer-shogi.org/wcsc31/appeal/PAL/wcsc31_PAL_detail.pdf
PALは、
・20b(ブロック)256ch。
// dlshogiは標準で10b192chなので計算量はおよそ2×(256/192)^2≒3.56 倍。
・入力次元 77×81
// 各升に対する先後の駒の利きの数はあり。dlshogiのように駒種ごとの利きはなし。
・活性化関数がSwish
// dlshogiもSwish。
・SEブロックあり
// ResNetの各畳込みブロックにSENet(Squeeze-and-Excitation Networks)ブロック (ボトルネック係数=8) を挿入。
のようです。
・詰将棋はやねうら王のdf-pnを参考に探索開始局面での詰みのみ調べている。
SEブロックを導入したのが新しいですね。20ブロックにしたのも入力特徴量がシンプルなのと相まってCPU側の負荷が小さそうです。あとleaf node(探索の末端局面)での詰将棋はなしのようです。
// 2021/05/23 20:00 追記 : dlshogiの山岡さんが大会中にPALの作者の山口さんに聞いたところ、技巧の3手詰め(Bonanzaの3手詰め相当)は呼び出しているそうです。これは1手詰め+αとみなして良いでしょう。
やねうら王のdf-pn(長手数詰将棋ルーチン)を参考にされているのは、私としては嬉しいですね。やねうら王の新しいdf-pnは、書くのにわりと苦労したのですが、読みやすく、流用しやすく、かつ高性能なので、今後、色んなソフトの詰将棋ルーチンに使われていくかも知れませんね。
また、計算資源的にはRTX3090 4基で7ヶ月あれば再現できるだろうとのことです。
// 私見ですが、現状であれば、GCTの学習データを使って、ある程度強くしてから、そこから自己対局で教師を生成すれば良いので、RTX3090 1基でも数ヶ月あればPALと同じぐらいの強さに出来ると思います。
“入力特徴としては先後の駒の位置 (28)、先後の駒の利き (28)、先後の駒の利き数(6)、持ち駒の数(14)、手番 (1) の合計 77 特徴平面の情報を採用した。”
と書いてあるので利きの情報入ってますよね.
駒ごとの利きがないだけですか…ほほー…。
2021年5月30日放送NHK杯 飯島八段vs大橋六段戦
PALの手のひら返しがホントに正しかったのか、疑問の声が出てますね。
(特に步の成捨てのところ)
もちろん超短時間で複雑な双玉問題に正解でないのはやむを得ませんが、ハイパワーマシンに10秒与えれば飯島八段より精度高くても良さそうな…(←失礼な奴)
なんとかちゃんねるでは、やねうら王も似た挙動してて、ハッシュとか同一手順戻り判定が悪さしているのではという噂が?
いや歩が減ってるから同一手順ちゃいますね…
ミュークルドリーミーからの梯子組なので、いつも途中からになっちゃうんだけど、目まぐるしいとか言ってたあたりの両者2桁%くらいの形勢のときって、どちらが有利とかあまり関係ないように思える。
最善手が○○ゼミでやったところだ状態になる時代になって、あえて最善手から外して相手の大チョンボ狙いの揺さぶりをかけるとか、そうなって行きつつあるというか。