月刊教師局面 2018年1月号

rezero18からdepth 8で生成した教師データ、100億局面を期間限定で公開します。(2018年2月19日までの限定公開)

https://drive.google.com/open?id=1n9yPdPTCRoUtadDhCpOJUPgbH6FJEoF7
https://drive.google.com/open?id=1y4NHLxpN6eun40vvz7PwJ8x1bhw4GZVD
https://drive.google.com/open?id=1MPaxUkYOkEI5iL5PuOwVroXNcDJ4YGrn

32手目でほぼ互角の局面から対局をスタートさせています。32手目で互角になるようにMultiPVを駆使して(なるべく互角になる指し手を選びつつ)進めて、そこから対局をさせるようなアルゴリズムとなっています。

この教師データで学習させたほうが、同じdepth 8で初手からランダムムーブ5回とかでそこから対局させて生成した教師データから学習させるより若干(+R10〜20程度)、強くなるようです。

ただこの教師データ、やたら圧縮できていて、元データの1/3ぐらいのファイルサイズになっています。同一局面が大量に含まれているわけではないと思いますが、類似局面が大量に含まれていたりする可能性がなくはないです。教師の生成も難しいですね…。

(Visited 1,721 time, 3 visit today)

月刊教師局面 2018年1月号” への7件のコメント

  1. それは生成した局面の評価値の大きさですよ。

    やねさんが配布している
    rezeroの評価値ゼロは
    圧縮容量814KBですよね。

    約2億個のパラメタを書き込んだ
    評価関数はzipに圧縮すると
    だいたい500MB程度だと思います。

    2億で600倍違いますね。
    これが100億なら1/3と変動しても不思議じゃありません。

    ランダムムーブの局面は
    とんでもない局面からの分岐が増え、
    教師の評価値も当然大きいものになるかと。

    まあ、この辺の数値で
    etaをチロッと変えると良い感じに。

    • あー、まあ、評価値の絶対値がゼロ付近に密集してるのは、確かにそうかも。しかし、それにしては圧縮が利きすぎているので、他にも要因がありそうな…。

      • 7zで圧縮した場合だと
        評価値の大きさに加えて、
        シャッフルしたかどうかでも違いますね。

        ノーシャッフルだとさらに半分くらいになったりします。

        圧縮ソフトによっては、
        圧縮のしやすさとかもあるみたいです。

  2. すみません 教師局面一月号のパート3をCorei
    7、loop10でやったのですがどれぐらい時間かかります?一週間で一つもできないのですが・・・

    • 40コア(80HT)のPCで100億局面の1周が8〜12時間ぐらいだったような…。4コア(8HT)ですとその10倍程度、loop 10ならそのさらに10倍程度…。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です