1手1秒で強い将棋ソフトは1手10秒でも強いのですか?その2

前回記事の続き。この連載、やねうら王の強さの秘密のすべてを曝け出している気がしなくもないのだが、こんなに赤裸々に書いてしまっていいものか悩むところではある。しかし本日また欲しいものリストに入れていた猫砂(1個5千円もする)が4個も届いたので届いた猫砂の数だけはやねうら王のアップデートをしたり、定跡を掘って公開するなり、記事を書くなりしなければなるまい。

続きを読む

1手1秒で強い将棋ソフトは1手10秒でも強いのですか?その1

「1手1秒で強い将棋ソフトが1手10秒でも強い」とは限らない。しかし、それはどういう条件の時にそう言えて、どういう条件の時にそう言えないのだろうか?これがわかると短い持ち時間で探索をチューニングすれば長い持ち時間で対局させた時も強いソフトが作れるはずである。

続きを読む

教師データはWCSC28終了まで公開しておきます

前の記事で、期間限定で「depth10で作った110億局面の教師データ」を公開したのだが、WCSC28のルールによると、大会終了(?)まで入手可能ではない教師データはライブラリとして使えないらしい。仕方がないな…この教師データをWCSC28のライブラリ申請するとともに、WCSC28終了まで公開しておくことをここに約束しよう。

続きを読む

何故、SDT5までにやねうら王は強くならなかったのか

今回、やねうら王は公開しているバージョンからほとんど強くすることが出来なかった。(KPP_KKPT型 評価関数でelmo+R170、探索部で+R20程度。elmo+rezero8 = relmo8がelmo+R120程度なので+R70ぐらいしか強くなっていない。) 私の本業のほうが忙しかったこともあるが、それを差し引くとしても、課題に対する取り組み方とか、方針の立て方とか、色々反省すべき点は多い。他の開発者が同じ轍を踏まぬよう、その原因をざっと書いておきたいと思う。

続きを読む

本大会のやねうら王は究極のリゼロ系

今回のやねうら王は、学習時に人間の棋譜を用いていない。いわゆるリゼロ系である。学習時に人間の定跡も用いていない。初期局面から何手かランダムムーブさせた局面からdepth 10で対局させたものを教師局面として用いている。

続きを読む

KPP interleaveとは何ですか?

銀座でelmoの瀧澤さんなどSDT5の参加予定の開発者でミニオフ会をしたのですが、集合までに時間があったのでドワンゴ本社の会議室を使わせてもらって、Qhapaqの澤田さん相手に、私が考えたKPP interleaveという技法を解説していました。

続きを読む