機械学習で使う用にhalf float(16-bit float)の演算ライブラリ作りました。と言ってもfloat型がIEEE 754の形式であることを仮定して、符号bitと指数部、小数部をそのままとってきてuint16_tに変換する、みたいな感じのお手軽実装ですが。
Half Float Library作りました
5
機械学習で使う用にhalf float(16-bit float)の演算ライブラリ作りました。と言ってもfloat型がIEEE 754の形式であることを仮定して、符号bitと指数部、小数部をそのままとってきてuint16_tに変換する、みたいな感じのお手軽実装ですが。
やねうら王の学習部を刷新したときに、この学習部にバグがないかを以下の手順で判定した。将棋ソフトの学習部をフルスクラッチで書いている他の開発者の参考になると思うので、その手順やデータを公開する。
やねうら王の学習部、う○こではないかと書いたばかりだが、コードを全面的に刷新した。tanuki-さんの協力もあって、とてもシンプルで美しいコードが書けたし、おまけに極めて省メモリで学習が出来るようになり(評価関数パラメーター用のメモリの4.5倍の学習用の重み配列があれば良い)、かつ、とても高速になった。
elmoはAperyの学習部を用いていた。何故、やねうら王の学習部を用いていなかったかと言うと、やねうら王の学習部がう○こだからだ。
WCSC27で優勝したelmoがもたらしたのは、たった一行の革命だった。
本日は第2期電王戦 第2局である。検討モードでやねうら王+elmoを使用されている方も多いと思うので、やねうら王の最近のコミットで何が変わったかざっと書いておこう。
将棋ソフトを検討用に使う場合、PV(読み筋)がきちんと出力されて欲しい。しかし思考を途中で打ち切った場合、PVが途中までしか出力されないことがある。
まふ定跡のまふさんが興味深いことを書かれていたのでざっと補足しておきます。