KKPPに関する知られざること

投稿日時: 2017年11月12日投稿者: やねうらお

4

第5回将棋電王トーナメント決勝日の朝にこの記事を書いています。
KKPP型評価関数について、あまり知られていないこと、知っていると有利なことをざっと書いておきます。

続きを読む →

コンピュータ将棋開発者がAWSで機械学習を回すには？

投稿日時: 2017年11月5日投稿者: やねうらお

4

電王トーナメント直前ですが、AWSを使って機械学習で使う教師局面を生成してみようと思い、昨日実際にやってみたので、そのノウハウを書いておきます。ノウハウというか、たぶんLinuxに慣れているような人なら誰でも知っているはずのことで、誰得記事ではあるのですが、私は大いに躓いたので記録として残しておきます。

続きを読む →

やねうら王、KPP_KKPT型評価関数に対応しました

投稿日時: 2017年9月2日投稿者: やねうらお

3

Q) KPP_KKPT型評価関数とは何ですか？
A) KPPT型に比べて、KPPの手番は用いないことにしたものです。評価関数ファイルのサイズが約半分になります。

続きを読む →

eta可変絞りについて

投稿日時: 2017年8月29日投稿者: やねうらお

19

SDT5に向けて徐々に手持ちの情報を公開していきます。

やねうら王の学習部はAdaGradを用いている。勾配をgとして、gの二乗を足し合わせたものを記憶しておき、これを基準にwを更新する。

続きを読む →

過去5年間の将棋ソフトの変遷

投稿日時: 2017年8月28日投稿者: やねうらお

9

今年のSDT(将棋電王トーナメント)の開催日が発表になりましたね。11月の11,12日だそうです。参加予定の皆さんの開発は捗っているでしょうか？やねうら王はまだ1㍉も強くなってませんが。

続きを読む →

lambda混合絞りについて

投稿日時: 2017年8月21日投稿者: やねうらお

4

やねうら王に1ヶ月ほど前につけたlambda混合絞りについて、なんとかちゃんねるで盛り上がっているようなのでこの機能について簡単に解説しときます。

続きを読む →

続) 評価関数をブリードすると何故強くなるのですか？

投稿日時: 2017年8月12日投稿者: やねうらお

8

前回記事の続き。やねうら王の学習部をAperyと比較するところから。前回記事の続き。やねうら王の学習部をAperyと比較するところから。

続きを読む →

評価関数をブリードすると何故強くなるのですか？

投稿日時: 2017年7月15日投稿者: やねうらお

9

評価関数を合成するのが流行っている。ここで言う合成とは、2つの評価関数のそれぞれのパラメーターを足して2で割ることである。ブレンドと呼ばれている。

続きを読む →

relmoの世界

投稿日時: 2017年7月5日投稿者: やねうらお

2

Q.relmo(リルモ)とは何ですか？
A.リゼロ評価関数とelmo(WCSC27)の評価関数を1:1でブレンドしたものです。rezero + elmo = relmo。

続きを読む →

【解決】gensfenで教師局面生成時に遅くなる問題

投稿日時: 2017年6月30日投稿者: やねうらお

7

やっと解決した(気がする)
開発者向けに原因を手短に書いておく。しかし、これがめっちゃ長い。

続きを読む →