やねうらおについて

BM98,BMSの生みの親 / ヒルズにオフィスのある某社CTO / プログラミング歴37年(5歳から) / 将棋ソフト「やねうら王」開発者 / 音楽理論ブログ / 天才(らしい) / 毎日が楽しすぎて死にそう

続) 人間の棋譜を用いずに評価関数の学習

投稿日時: 2017年6月13日投稿者: やねうらお

10

前回の続き。今回はリゼロ評価関数epoch 5,6。やねうら王のGitHubのほうには、すでにアップロードしてある。興味のある人は、使ってみて欲しい。

続きを読む →

人間の棋譜を用いずに評価関数の学習に成功

投稿日時: 2017年6月12日投稿者: やねうらお

39

今回、新たに評価関数をゼロベクトルから学習させた。elmo絞りを使うと意外と簡単にApery(WCSC26)相当の棋力を持つ評価関数にまで出来るようだ。追試できるように記事の前半に手順を記しておく。また、記事の後半には何回目のelmo絞りでどの程度の強さであったかも示す。

続きを読む →

elmo絞りで半年を4時間半に

投稿日時: 2017年6月11日投稿者: やねうらお

3

昨年のAperyであるApery(WCSC26)。そのおおよそ半年後のバージョンである「浮かむ瀬」。多くの協力者に教師局面の生成を手伝ってもらうことで飛躍的に進化したことは記憶に新しいですね。

続きを読む →

fail low/highしたときの読み筋の出力

投稿日時: 2017年6月8日投稿者: やねうらお

2

最近、やねうら王では、fail low/highしたときに読み筋を出力するかどうかを思考エンジン設定で変更できるようにした。

続きを読む →

Half Float Library作りました

投稿日時: 2017年5月29日投稿者: やねうらお

5

機械学習で使う用にhalf float(16-bit float)の演算ライブラリ作りました。と言ってもfloat型がIEEE 754の形式であることを仮定して、符号bitと指数部、小数部をそのままとってきてuint16_tに変換する、みたいな感じのお手軽実装ですが。

続きを読む →

elmoは何故2周目の雑巾を絞れないのか

投稿日時: 2017年5月27日投稿者: やねうらお

13

WCSC27のelmoのアピール文書より。

続きを読む →

将棋ソフトの機械学習の成否を判定するための資料

投稿日時: 2017年5月26日投稿者: やねうらお

6

やねうら王の学習部を刷新したときに、この学習部にバグがないかを以下の手順で判定した。将棋ソフトの学習部をフルスクラッチで書いている他の開発者の参考になると思うので、その手順やデータを公開する。

続きを読む →

やねうら王の学習部、すごく良くなったよ

投稿日時: 2017年5月26日投稿者: やねうらお

6

やねうら王の学習部、う○こではないかと書いたばかりだが、コードを全面的に刷新した。tanuki-さんの協力もあって、とてもシンプルで美しいコードが書けたし、おまけに極めて省メモリで学習が出来るようになり(評価関数パラメーター用のメモリの4.5倍の学習用の重み配列があれば良い)、かつ、とても高速になった。

続きを読む →

何故、やねうら王の学習部はう○こなのか

投稿日時: 2017年5月24日投稿者: やねうらお

5

elmoはAperyの学習部を用いていた。何故、やねうら王の学習部を用いていなかったかと言うと、やねうら王の学習部がう○こだからだ。

続きを読む →

elmoがもたらしたオーパーツについて

投稿日時: 2017年5月23日投稿者: やねうらお

9

WCSC27で優勝したelmoがもたらしたのは、たった一行の革命だった。

続きを読む →