評価値がオーバーフローするとどうなりますか？

投稿日時: 2017年11月19日投稿者: やねうらお

今年の6月ごろ、色んな人から、やねうら王だと教師局面の生成が終わらないことがあるという報告を受けた。

何故、SDT5までにやねうら王は強くならなかったのか

投稿日時: 2017年11月19日投稿者: やねうらお

今回、やねうら王は公開しているバージョンからほとんど強くすることが出来なかった。(KPP_KKPT型評価関数でelmo+R170、探索部で+R20程度。elmo+rezero8 = relmo8がelmo+R120程度なので+R70ぐらいしか強くなっていない。) 私の本業のほうが忙しかったこともあるが、それを差し引くとしても、課題に対する取り組み方とか、方針の立て方とか、色々反省すべき点は多い。他の開発者が同じ轍を踏まぬよう、その原因をざっと書いておきたいと思う。

続きを読む →

freeze_kkは何のためにあるのですか？

投稿日時: 2017年11月19日投稿者: やねうらお

返信

やねうら王のlearnコマンドのfreeze_kk/kkp/kppは何のためにあるのか、説明を書いておく。

続きを読む →

定跡をdepth 34で掘るときに知っておくべきこと

投稿日時: 2017年11月12日投稿者: やねうらお

今回の大会(第5回将棋電王トーナメント)でのやねうら王は、定跡をdepth 34で掘った。

続きを読む →

本大会のやねうら王は究極のリゼロ系

投稿日時: 2017年11月12日投稿者: やねうらお

今回のやねうら王は、学習時に人間の棋譜を用いていない。いわゆるリゼロ系である。学習時に人間の定跡も用いていない。初期局面から何手かランダムムーブさせた局面からdepth 10で対局させたものを教師局面として用いている。

続きを読む →

評価関数のブレンドに関する知られざること

投稿日時: 2017年11月12日投稿者: やねうらお

今回の大会、決勝に進出した12チームのうち、Ponanza、Apery、Seleneを除く9チームがやねうら王チルドレン。

続きを読む →

KKPPに関する知られざること

投稿日時: 2017年11月12日投稿者: やねうらお

第5回将棋電王トーナメント決勝日の朝にこの記事を書いています。
KKPP型評価関数について、あまり知られていないこと、知っていると有利なことをざっと書いておきます。

続きを読む →

コンピュータ将棋開発者がAWSで機械学習を回すには？

投稿日時: 2017年11月5日投稿者: やねうらお

電王トーナメント直前ですが、AWSを使って機械学習で使う教師局面を生成してみようと思い、昨日実際にやってみたので、そのノウハウを書いておきます。ノウハウというか、たぶんLinuxに慣れているような人なら誰でも知っているはずのことで、誰得記事ではあるのですが、私は大いに躓いたので記録として残しておきます。

続きを読む →

やねうら王、KPP_KKPT型評価関数に対応しました

投稿日時: 2017年9月2日投稿者: やねうらお

Q) KPP_KKPT型評価関数とは何ですか？
A) KPPT型に比べて、KPPの手番は用いないことにしたものです。評価関数ファイルのサイズが約半分になります。

続きを読む →

eta可変絞りについて

投稿日時: 2017年8月29日投稿者: やねうらお

SDT5に向けて徐々に手持ちの情報を公開していきます。

やねうら王の学習部はAdaGradを用いている。勾配をgとして、gの二乗を足し合わせたものを記憶しておき、これを基準にwを更新する。

続きを読む →

やねうら王公式サイト

コンピューター将棋やねうら王公式サイト

「やねうら王」カテゴリーアーカイブ

評価値がオーバーフローするとどうなりますか？

何故、SDT5までにやねうら王は強くならなかったのか

freeze_kkは何のためにあるのですか？

定跡をdepth 34で掘るときに知っておくべきこと

本大会のやねうら王は究極のリゼロ系

評価関数のブレンドに関する知られざること

KKPPに関する知られざること

コンピュータ将棋開発者がAWSで機械学習を回すには？

やねうら王、KPP_KKPT型評価関数に対応しました

eta可変絞りについて