私のほう、発表資料の準備があまり出来てなくて、そして、こういう発表に不慣れで聞きづらかったと思う。聞きに来てくれた人たちには申し訳ない。
「やねうら王」カテゴリーアーカイブ
7
DeepMind社がやねうら王に注目し始めたようです
DeepMindがAlphaGo Zeroで使われた手法をチェスと将棋に適用して、チェスと将棋の世界でもぶっちぎり強いソフトが出来たそうです。(私は、内容は詳しく読んでいません。)
WCSC28のライブラリ規程について
教師データをライブラリとして公開した場合、WCSC28の大会当日まで公開しておかないといけないのかなと思っていたのですが、WCSC28の大会ルールが発表されたのを機に、CSAの香山さんのほうにメールで確認してみました。
教師データはWCSC28終了まで公開しておきます
depth10で作った110億局面の教師データ、期間限定で公開します
SDT5の直前にAWSで20万円かけて生成したという例のやつです。
Stockfishがもたらさなかったもの
昨年ぐらいからStockfishの改良点を取り込んでもほとんど強くならないというのが続いている。いまや、Stockfishによって将棋ソフトにもたらされるレーティング向上は年間R30にも満たないように思う。
Apery(SDT5)の評価関数はどれくらい強いのですか?
本大会で最強の評価関数はAperyのものだと私はくどいほど言い続けたが、それを確認しておく。
評価値がオーバーフローするとどうなりますか?
今年の6月ごろ、色んな人から、やねうら王だと教師局面の生成が終わらないことがあるという報告を受けた。
何故、SDT5までにやねうら王は強くならなかったのか
今回、やねうら王は公開しているバージョンからほとんど強くすることが出来なかった。(KPP_KKPT型 評価関数でelmo+R170、探索部で+R20程度。elmo+rezero8 = relmo8がelmo+R120程度なので+R70ぐらいしか強くなっていない。) 私の本業のほうが忙しかったこともあるが、それを差し引くとしても、課題に対する取り組み方とか、方針の立て方とか、色々反省すべき点は多い。他の開発者が同じ轍を踏まぬよう、その原因をざっと書いておきたいと思う。
freeze_kkは何のためにあるのですか?
やねうら王のlearnコマンドのfreeze_kk/kkp/kppは何のためにあるのか、説明を書いておく。