dlshogiの山岡さんから詫び石が配られるかも

今回、WCSC31(第31回世界コンピュータ将棋選手権)では二次予選敗退となってしまったdlshogi with GCTですが、詫び石(高poで生成された教師データ)が配られるかもしれないです。

何に対してお詫びされいるのかは私はよく知らないんですが、どうやら、dl(Deep Learning)勢で、決勝に進んだのはPALだけであったことに対して山岡さんはその責任を感じておられるようです。

最終的に2400/2800 poの強化学習データ(教師局面)が億単位であるそうです。
ここから学習させるだけでfloodgateのGCTモデルぐらいのレートにはなるそうです。

// 私の推測ですが、GeForce RTX 3090で生成した場合、数ヶ月～1年ぐらいかかる分量だと思います。金銭的な価値に換算すると100万円分ぐらい？

教師生成は学習に比べて桁違いのマシンリソースが必要ですが、このデータがもし本当に公開されたら、格安GPUで学習を回すだけで最強クラスの将棋ソフトが簡単に作れることになります。

今回のWCSC、教師データを用意できないせいか、dl採用チームが思ったより少なかったように思うのですが、これで一気に進展するかも知れませんね。

早く詫び石が配られることを祈りつつ正座待機しておきます。何の詫びなのかはマジでわかっていませんが、山岡さんのご厚意に感謝いたします。

やねうら王公式サイト