大きな局面ファイルのシャッフルについて

将棋の局面をただひたすら書きだしたファイル(仮にテキストファイルだとする)があるとして、機械学習をオンライン学習系のアルゴリズムを用いる場合、最後のほうに学習させたデータに引っ張られる傾向があるため、この局面データ(テキストファイルの各行)が事前にランダムシャッフルされていて欲しいというのはあります。

続きを読む

将棋の局面を256bitに圧縮するには?

Ponanzaに倣い、大量に自己対戦棋譜を生成してそれをもとに強化学習をやりたいわけですが、この生成を誰かに手伝ってもらおうと思ったときに棋譜のファイルサイズが大きいので、そのやりとりが意外と大変です。
続きを読む

マシン1000台きぼんぬ

短い持ち時間と長い持ち時間とで、探索パラメーターのチューニングの方針が違うため、長い持ち時間でチューニングしたいパラメーターがいくつかあるのですが、4スレッド1手15秒だと、1局に30分ぐらいかかります。3000対局させるのに107日かかります。

続きを読む

魔女をめぐる冒険

やねうら王2016 Midが魔女(SilentMajority)と同じぐらいの強さになったところで、魔女の強さの秘密を書いていこう。というより、まずは、何故それまでのやねうら王が魔女より弱かったのかを書いておこう。あらかじめ言っておくけど、今回の記事は超長いぞ!

続きを読む