やねうら王2016Midのほう、学習部も一通り書けたので、これで安定バージョンとします。
続きを読む
やねうら王2016Mid、final version公開しました
3
やねうら王2016Midのほう、学習部も一通り書けたので、これで安定バージョンとします。
続きを読む
私はかねてより評価関数ファイルを(評価関数パラメーターを)ゼロベクトルから学習させる必要性があると感じてました。これは、世界コンピュータ将棋選手権のルールにおいては、例えば、Aperyの評価関数から追加学習させるとAperyのライブラリを用いたことになり、ライブラリ申請をするときにAperyと書かないといけないからです。
表題の件を当事者視点で。
やねうら王2016Midでdepth6で探索した教師用局面ファイル45億局面分を期間限定で配布します。
昨日、こんな記事を書いたのです。
やねうら王 定跡フォーマット2016ではsfen文字列とそれに対応する(その局面での定跡となる)指し手をずらずらと書くようになっているのですが、sfen文字列は、一意に定まらないということをすっかり忘れていました。
とりあえず40コア80HTのPCで1週間ほどかけて生成出来た分を、やねうら大定跡V1として公開します。
今回は、やねうら王を使って定跡を作る方法について解説します。
やねうら大定跡とは?
将棋の局面をただひたすら書きだしたファイル(仮にテキストファイルだとする)があるとして、機械学習をオンライン学習系のアルゴリズムを用いる場合、最後のほうに学習させたデータに引っ張られる傾向があるため、この局面データ(テキストファイルの各行)が事前にランダムシャッフルされていて欲しいというのはあります。