Apery(SDT5)の評価関数はどれくらい強いのですか？

投稿日時: 2017年11月20日投稿者: やねうらお

5

本大会で最強の評価関数はAperyのものだと私はくどいほど言い続けたが、それを確認しておく。

続きを読む →

評価関数をゼロから学習させるときに駒割りも学習させる話

投稿日時: 2017年11月19日投稿者: やねうらお

15

リゼロ評価関数では、評価関数をゼロから学習させているが、駒割り(駒の点数)は、Aperyのソースコードで定義されている点数を初期値として用いてある。実際のところ、これがすべてゼロであってもきちんと学習できることは確かめた。

続きを読む →

freeze_kkは何のためにあるのですか？

投稿日時: 2017年11月19日投稿者: やねうらお

返信

やねうら王のlearnコマンドのfreeze_kk/kkp/kppは何のためにあるのか、説明を書いておく。

続きを読む →

本大会のやねうら王は究極のリゼロ系

投稿日時: 2017年11月12日投稿者: やねうらお

8

今回のやねうら王は、学習時に人間の棋譜を用いていない。いわゆるリゼロ系である。学習時に人間の定跡も用いていない。初期局面から何手かランダムムーブさせた局面からdepth 10で対局させたものを教師局面として用いている。

続きを読む →

評価関数のブレンドに関する知られざること

投稿日時: 2017年11月12日投稿者: やねうらお

1

今回の大会、決勝に進出した12チームのうち、Ponanza、Apery、Seleneを除く9チームがやねうら王チルドレン。

続きを読む →

コンピュータ将棋開発者がAWSで機械学習を回すには？

投稿日時: 2017年11月5日投稿者: やねうらお

4

電王トーナメント直前ですが、AWSを使って機械学習で使う教師局面を生成してみようと思い、昨日実際にやってみたので、そのノウハウを書いておきます。ノウハウというか、たぶんLinuxに慣れているような人なら誰でも知っているはずのことで、誰得記事ではあるのですが、私は大いに躓いたので記録として残しておきます。

続きを読む →

eta可変絞りについて

投稿日時: 2017年8月29日投稿者: やねうらお

19

SDT5に向けて徐々に手持ちの情報を公開していきます。

やねうら王の学習部はAdaGradを用いている。勾配をgとして、gの二乗を足し合わせたものを記憶しておき、これを基準にwを更新する。

続きを読む →

lambda混合絞りについて

投稿日時: 2017年8月21日投稿者: やねうらお

4

やねうら王に1ヶ月ほど前につけたlambda混合絞りについて、なんとかちゃんねるで盛り上がっているようなのでこの機能について簡単に解説しときます。

続きを読む →

評価関数のキメラ化コマンド公開しました

投稿日時: 2017年6月28日投稿者: やねうらお

17

『Shivoray』(全自動雑巾絞り機)以降、誰でも評価関数を自分で育成することが出来るようになった。教師局面の生成に用いる定跡を変えることで異なった進化を遂げることも徐々に明らかになってきた。今回はこの流れを加速すべく、キメラ化コマンドを公開することにした。

続きを読む →

『Shivoray』(全自動雑巾絞り機)公開しました

投稿日時: 2017年6月26日投稿者: やねうらお

58

自分で自分好みの評価関数を作って遊んでみたいという人のために『Shivoray』(シボレー)という全自動雑巾絞り機を公開しました。続きを読む →