rezero18からdepth 8で生成した教師データ、100億局面を期間限定で公開します。(2018年2月19日までの限定公開)
https://drive.google.com/open?id=1n9yPdPTCRoUtadDhCpOJUPgbH6FJEoF7
https://drive.google.com/open?id=1y4NHLxpN6eun40vvz7PwJ8x1bhw4GZVD
https://drive.google.com/open?id=1MPaxUkYOkEI5iL5PuOwVroXNcDJ4YGrn
32手目でほぼ互角の局面から対局をスタートさせています。32手目で互角になるようにMultiPVを駆使して(なるべく互角になる指し手を選びつつ)進めて、そこから対局をさせるようなアルゴリズムとなっています。
この教師データで学習させたほうが、同じdepth 8で初手からランダムムーブ5回とかでそこから対局させて生成した教師データから学習させるより若干(+R10〜20程度)、強くなるようです。
ただこの教師データ、やたら圧縮できていて、元データの1/3ぐらいのファイルサイズになっています。同一局面が大量に含まれているわけではないと思いますが、類似局面が大量に含まれていたりする可能性がなくはないです。教師の生成も難しいですね…。
それは生成した局面の評価値の大きさですよ。
やねさんが配布している
rezeroの評価値ゼロは
圧縮容量814KBですよね。
約2億個のパラメタを書き込んだ
評価関数はzipに圧縮すると
だいたい500MB程度だと思います。
2億で600倍違いますね。
これが100億なら1/3と変動しても不思議じゃありません。
ランダムムーブの局面は
とんでもない局面からの分岐が増え、
教師の評価値も当然大きいものになるかと。
まあ、この辺の数値で
etaをチロッと変えると良い感じに。
あー、まあ、評価値の絶対値がゼロ付近に密集してるのは、確かにそうかも。しかし、それにしては圧縮が利きすぎているので、他にも要因がありそうな…。
7zで圧縮した場合だと
評価値の大きさに加えて、
シャッフルしたかどうかでも違いますね。
ノーシャッフルだとさらに半分くらいになったりします。
圧縮ソフトによっては、
圧縮のしやすさとかもあるみたいです。
あー!今回、シャッフルしてませんわ!!
それで局面が連続してて、圧縮がかかりやすいってことですか…。なるほろ。
すみません 教師局面一月号のパート3をCorei
7、loop10でやったのですがどれぐらい時間かかります?一週間で一つもできないのですが・・・
40コア(80HT)のPCで100億局面の1周が8〜12時間ぐらいだったような…。4コア(8HT)ですとその10倍程度、loop 10ならそのさらに10倍程度…。
まじですか・・・ありがとうございます。
どこで書けばいいのか分からないのでここに書きます。
rezero19を公開してくれませんか。
他に強い評価関数がたくさんあるので、あまり公開する意義を感じないというか…。> rezero19
とりま、製品版にはバンドルされてますし > kpp_kkpt型のrezeroの最新版
>他に強い評価関数がたくさんあるので、あまり公開する意義を感じないというか…。
でもrezero特有の指し方が見たいのでどうかお願いします!
一応、rezeroシリーズの最新版(最終版?)が、『将棋神やねうら王』に収録してあるので、まあ、これでいいかなと…。
>>32手目でほぼ互角の局面から対局をスタートさせてい
ます。32手目で互角になるようにMultiPVを駆使して
(なるべく互角になる指し手を選びつつ)進めて、そこ
から対局をさせるようなアルゴリズムとなっていま
す。
これって、一般人でも出来ますか?
“gensfen2018″コマンドがそういうコードになっています。あまり気にいらなかったので、このコード廃止にしましたけども。
以下のフォルダに移動させてあるので、これ持ってきてビルドしなおすなりすれば使えます。(プログラミングの知識、多少必要ですけど)
https://github.com/yaneurao/YaneuraOu/blob/master/source/old_engines/gensfen/gensfen2018.cpp
色々とありがとうございます(v^_^)v
今c++学んでいるので、ついでといってはなんですが、色々勉強させて頂きます。
はい(`・ω・´)b