Countermove(応手)とは何ですか？

投稿日時: 2018年5月1日投稿者: やねうらお

返信

いま、待ち合わせのため時間が30分ほどあるので記事２つほど書く。

Qhapaqさんが技術書典4で『科学するコンピュータ将棋』という同人誌を販売された。

続きを読む →

DeepMind社がやねうら王に注目し始めたようです

投稿日時: 2017年12月7日投稿者: やねうらお

DeepMindがAlphaGo Zeroで使われた手法をチェスと将棋に適用して、チェスと将棋の世界でもぶっちぎり強いソフトが出来たそうです。(私は、内容は詳しく読んでいません。)

続きを読む →

教師データはWCSC28終了まで公開しておきます

投稿日時: 2017年11月27日投稿者: やねうらお

前の記事で、期間限定で「depth10で作った110億局面の教師データ」を公開したのだが、WCSC28のルールによると、大会終了(?)まで入手可能ではない教師データはライブラリとして使えないらしい。仕方がないな…この教師データをWCSC28のライブラリ申請するとともに、WCSC28終了まで公開しておくことをここに約束しよう。

続きを読む →

Stockfishがもたらさなかったもの

投稿日時: 2017年11月20日投稿者: やねうらお

昨年ぐらいからStockfishの改良点を取り込んでもほとんど強くならないというのが続いている。いまや、Stockfishによって将棋ソフトにもたらされるレーティング向上は年間R30にも満たないように思う。

続きを読む →

Apery(SDT5)の評価関数はどれくらい強いのですか？

投稿日時: 2017年11月20日投稿者: やねうらお

本大会で最強の評価関数はAperyのものだと私はくどいほど言い続けたが、それを確認しておく。

続きを読む →

評価値がオーバーフローするとどうなりますか？

投稿日時: 2017年11月19日投稿者: やねうらお

今年の6月ごろ、色んな人から、やねうら王だと教師局面の生成が終わらないことがあるという報告を受けた。

続きを読む →

評価関数をゼロから学習させるときに駒割りも学習させる話

投稿日時: 2017年11月19日投稿者: やねうらお

リゼロ評価関数では、評価関数をゼロから学習させているが、駒割り(駒の点数)は、Aperyのソースコードで定義されている点数を初期値として用いてある。実際のところ、これがすべてゼロであってもきちんと学習できることは確かめた。

続きを読む →

何故、SDT5までにやねうら王は強くならなかったのか

投稿日時: 2017年11月19日投稿者: やねうらお

今回、やねうら王は公開しているバージョンからほとんど強くすることが出来なかった。(KPP_KKPT型評価関数でelmo+R170、探索部で+R20程度。elmo+rezero8 = relmo8がelmo+R120程度なので+R70ぐらいしか強くなっていない。) 私の本業のほうが忙しかったこともあるが、それを差し引くとしても、課題に対する取り組み方とか、方針の立て方とか、色々反省すべき点は多い。他の開発者が同じ轍を踏まぬよう、その原因をざっと書いておきたいと思う。

続きを読む →

freeze_kkは何のためにあるのですか？

投稿日時: 2017年11月19日投稿者: やねうらお

返信

やねうら王のlearnコマンドのfreeze_kk/kkp/kppは何のためにあるのか、説明を書いておく。

続きを読む →

256手ルールが前大会から改変されていた件

投稿日時: 2017年11月13日投稿者: やねうらお

今回の電王トーナメントで256手ルールが問題になった。

続きを読む →

やねうら王公式サイト

コンピューター将棋やねうら王公式サイト

「コンピューター将棋全般」カテゴリーアーカイブ

Countermove(応手)とは何ですか？

DeepMind社がやねうら王に注目し始めたようです

教師データはWCSC28終了まで公開しておきます

Stockfishがもたらさなかったもの

Apery(SDT5)の評価関数はどれくらい強いのですか？

評価値がオーバーフローするとどうなりますか？

評価関数をゼロから学習させるときに駒割りも学習させる話

何故、SDT5までにやねうら王は強くならなかったのか

freeze_kkは何のためにあるのですか？

256手ルールが前大会から改変されていた件