やねうらおについて

BM98,BMSの生みの親 / ヒルズにオフィスのある某社CTO / プログラミング歴37年(5歳から) / 将棋ソフト「やねうら王」開発者 / 音楽理論ブログ / 天才(らしい) / 毎日が楽しすぎて死にそう

強化学習の途中でのアーキテクチャーの変更

投稿日時: 2016年11月25日投稿者: やねうらお

返信

強化学習を用いて機械学習をさせているときに、エージェントのアーキテクチャーを途中で変更したいことが多々あります。将棋ソフトで言うと評価関数の形を途中で変更したいということですね。

続きを読む →

55将棋、56将棋で最適な評価関数は？

投稿日時: 2016年11月24日投稿者: やねうらお

とりあえず、55将棋に絞って話を進める。55将棋では駒は12枚しかない。K(King)を除くと、10枚しかない。

続きを読む →

王手将棋用評価関数ファイルV5を公開しました

投稿日時: 2016年11月24日投稿者: やねうらお

前回からさらにR200ほど強くした。

続きを読む →

王手将棋用評価関数ファイルV4を公開しました

投稿日時: 2016年11月23日投稿者: やねうらお

V3にも必勝手順が発見されてしまった。

続きを読む →

王手将棋用評価関数ファイルV3を公開しました

投稿日時: 2016年11月23日投稿者: やねうらお

王手将棋用の評価関数ファイルV2を公開して、わずか数時間で必勝法を見つけてこのブログにコメントをくださった人がいた。本当、インターネットは凄い人博覧会である。これには参った。

続きを読む →

王手将棋用評価関数ファイルV2を公開しました

投稿日時: 2016年11月22日投稿者: やねうらお

王手将棋用評価関数ファイルV1で真やねうら王の評価関数からR300上がった時は驚きだっだったが、王手将棋用評価関数ファイルV1からさらにR340ほど上げることに成功したので、ここに公開する。

続きを読む →

王手将棋におけるハマり局面

投稿日時: 2016年11月22日投稿者: やねうらお

昨日の記事のコメント欄で教えてもらった手順が、やねうら王の王手将棋エディションで回避できない。

続きを読む →

王手将棋専用評価関数ファイルV1が出来ました

投稿日時: 2016年11月21日投稿者: やねうらお

やねうら王王手将棋エディションで使える、王手将棋専用評価関数ファイルV1を作ってみたので王手将棋に詳しい人たちはちょっと試して欲しい。

王手将棋専用評価関数ファイルV1
https://drive.google.com/file/d/0Bzbi5rbfN85NOEF6QWFienZrSDg/view

4スレ1秒,3秒で真やねうら王からR300ぐらい向上している…ようだ。自分でもにわかに信じられないが、囲い方が全く違うので、本当に強くなっているのかも知れない。検証求む！

王手将棋は本将棋とどれくらい異なるのですか？

投稿日時: 2016年11月21日投稿者: やねうらお

王手将棋は本将棋の評価関数など搭載するぐらいなら計算力に任せてひたすら読みに徹するほうが強いのではないかというコメントを頂戴したが、決してそんなことはない。

続きを読む →

やねうら王王手将棋エディションを仮公開しました

投稿日時: 2016年11月20日投稿者: やねうらお

やねうら王のほう、王手将棋に対応させた。王手をするとその時点で勝ちという変則ルールの将棋である。

続きを読む →

やねうら王公式サイト

コンピューター将棋やねうら王公式サイト

投稿者「やねうらお」のアーカイブ

やねうらおについて

強化学習の途中でのアーキテクチャーの変更

55将棋、56将棋で最適な評価関数は？

王手将棋用評価関数ファイルV5を公開しました

王手将棋用評価関数ファイルV4を公開しました

王手将棋用評価関数ファイルV3を公開しました

王手将棋用評価関数ファイルV2を公開しました

王手将棋におけるハマり局面

王手将棋専用評価関数ファイルV1が出来ました

王手将棋は本将棋とどれくらい異なるのですか？

やねうら王王手将棋エディションを仮公開しました

やねうらお について

やねうらおについて