DeepMind社がやねうら王に注目し始めたようです

投稿日時: 2017年12月7日投稿者: やねうらお

DeepMindがAlphaGo Zeroで使われた手法をチェスと将棋に適用して、チェスと将棋の世界でもぶっちぎり強いソフトが出来たそうです。(私は、内容は詳しく読んでいません。)

教師データはWCSC28終了まで公開しておきます

投稿日時: 2017年11月27日投稿者: やねうらお

前の記事で、期間限定で「depth10で作った110億局面の教師データ」を公開したのだが、WCSC28のルールによると、大会終了(?)まで入手可能ではない教師データはライブラリとして使えないらしい。仕方がないな…この教師データをWCSC28のライブラリ申請するとともに、WCSC28終了まで公開しておくことをここに約束しよう。

続きを読む →

depth10で作った110億局面の教師データ、期間限定で公開します

投稿日時: 2017年11月21日投稿者: やねうらお

SDT5の直前にAWSで20万円かけて生成したという例のやつです。

続きを読む →

Apery(SDT5)の評価関数はどれくらい強いのですか？

投稿日時: 2017年11月20日投稿者: やねうらお

本大会で最強の評価関数はAperyのものだと私はくどいほど言い続けたが、それを確認しておく。

続きを読む →

評価関数をゼロから学習させるときに駒割りも学習させる話

投稿日時: 2017年11月19日投稿者: やねうらお

リゼロ評価関数では、評価関数をゼロから学習させているが、駒割り(駒の点数)は、Aperyのソースコードで定義されている点数を初期値として用いてある。実際のところ、これがすべてゼロであってもきちんと学習できることは確かめた。

続きを読む →

freeze_kkは何のためにあるのですか？

投稿日時: 2017年11月19日投稿者: やねうらお

返信

やねうら王のlearnコマンドのfreeze_kk/kkp/kppは何のためにあるのか、説明を書いておく。

続きを読む →

本大会のやねうら王は究極のリゼロ系

投稿日時: 2017年11月12日投稿者: やねうらお

今回のやねうら王は、学習時に人間の棋譜を用いていない。いわゆるリゼロ系である。学習時に人間の定跡も用いていない。初期局面から何手かランダムムーブさせた局面からdepth 10で対局させたものを教師局面として用いている。

続きを読む →

評価関数のブレンドに関する知られざること

投稿日時: 2017年11月12日投稿者: やねうらお

今回の大会、決勝に進出した12チームのうち、Ponanza、Apery、Seleneを除く9チームがやねうら王チルドレン。

続きを読む →

コンピュータ将棋開発者がAWSで機械学習を回すには？

投稿日時: 2017年11月5日投稿者: やねうらお

電王トーナメント直前ですが、AWSを使って機械学習で使う教師局面を生成してみようと思い、昨日実際にやってみたので、そのノウハウを書いておきます。ノウハウというか、たぶんLinuxに慣れているような人なら誰でも知っているはずのことで、誰得記事ではあるのですが、私は大いに躓いたので記録として残しておきます。

続きを読む →

eta可変絞りについて

投稿日時: 2017年8月29日投稿者: やねうらお

SDT5に向けて徐々に手持ちの情報を公開していきます。

やねうら王の学習部はAdaGradを用いている。勾配をgとして、gの二乗を足し合わせたものを記憶しておき、これを基準にwを更新する。

続きを読む →

やねうら王公式サイト

コンピューター将棋やねうら王公式サイト

「機械学習」カテゴリーアーカイブ

DeepMind社がやねうら王に注目し始めたようです

教師データはWCSC28終了まで公開しておきます

depth10で作った110億局面の教師データ、期間限定で公開します

Apery(SDT5)の評価関数はどれくらい強いのですか？

評価関数をゼロから学習させるときに駒割りも学習させる話

freeze_kkは何のためにあるのですか？

本大会のやねうら王は究極のリゼロ系

評価関数のブレンドに関する知られざること

コンピュータ将棋開発者がAWSで機械学習を回すには？

eta可変絞りについて