やねうらお について

BM98,BMSの生みの親 / ヒルズにオフィスのある某社CTO / プログラミング歴37年(5歳から) / 将棋ソフト「やねうら王」開発者 / 音楽理論ブログ / 天才(らしい) / 毎日が楽しすぎて死にそう

強化学習の途中でのアーキテクチャーの変更

強化学習を用いて機械学習をさせているときに、エージェントのアーキテクチャーを途中で変更したいことが多々あります。将棋ソフトで言うと評価関数の形を途中で変更したいということですね。

続きを読む

王手将棋用評価関数ファイルV3を公開しました

王手将棋用の評価関数ファイルV2を公開して、わずか数時間で必勝法を見つけてこのブログにコメントをくださった人がいた。本当、インターネットは凄い人博覧会である。これには参った。

続きを読む

王手将棋用評価関数ファイルV2を公開しました

王手将棋用評価関数ファイルV1で真やねうら王の評価関数からR300上がった時は驚きだっだったが、王手将棋用評価関数ファイルV1からさらにR340ほど上げることに成功したので、ここに公開する。

続きを読む

王手将棋専用評価関数ファイルV1が出来ました

やねうら王 王手将棋エディションで使える、王手将棋専用評価関数ファイルV1を作ってみたので王手将棋に詳しい人たちはちょっと試して欲しい。

王手将棋専用評価関数ファイルV1
https://drive.google.com/file/d/0Bzbi5rbfN85NOEF6QWFienZrSDg/view

4スレ1秒,3秒で真やねうら王からR300ぐらい向上している…ようだ。自分でもにわかに信じられないが、囲い方が全く違うので、本当に強くなっているのかも知れない。検証求む!