評価関数をゼロから学習させるときに駒割りも学習させる話

リゼロ評価関数では、評価関数をゼロから学習させているが、駒割り(駒の点数)は、Aperyのソースコードで定義されている点数を初期値として用いてある。実際のところ、これがすべてゼロであってもきちんと学習できることは確かめた。

続きを読む

本大会のやねうら王は究極のリゼロ系

今回のやねうら王は、学習時に人間の棋譜を用いていない。いわゆるリゼロ系である。学習時に人間の定跡も用いていない。初期局面から何手かランダムムーブさせた局面からdepth 10で対局させたものを教師局面として用いている。

続きを読む

コンピュータ将棋開発者がAWSで機械学習を回すには?

電王トーナメント直前ですが、AWSを使って機械学習で使う教師局面を生成してみようと思い、昨日実際にやってみたので、そのノウハウを書いておきます。ノウハウというか、たぶんLinuxに慣れているような人なら誰でも知っているはずのことで、誰得記事ではあるのですが、私は大いに躓いたので記録として残しておきます。

続きを読む

評価関数のキメラ化コマンド公開しました

『Shivoray』(全自動雑巾絞り機)以降、誰でも評価関数を自分で育成することが出来るようになった。教師局面の生成に用いる定跡を変えることで異なった進化を遂げることも徐々に明らかになってきた。今回はこの流れを加速すべく、キメラ化コマンドを公開することにした。

続きを読む