月刊教師局面 2018年1月号

投稿日時: 2018年1月23日投稿者: やねうらお

rezero18からdepth 8で生成した教師データ、100億局面を期間限定で公開します。(2018年2月19日までの限定公開)

https://drive.google.com/open?id=1n9yPdPTCRoUtadDhCpOJUPgbH6FJEoF7
https://drive.google.com/open?id=1y4NHLxpN6eun40vvz7PwJ8x1bhw4GZVD
https://drive.google.com/open?id=1MPaxUkYOkEI5iL5PuOwVroXNcDJ4YGrn

32手目でほぼ互角の局面から対局をスタートさせています。32手目で互角になるようにMultiPVを駆使して(なるべく互角になる指し手を選びつつ)進めて、そこから対局をさせるようなアルゴリズムとなっています。

この教師データで学習させたほうが、同じdepth 8で初手からランダムムーブ5回とかでそこから対局させて生成した教師データから学習させるより若干(+R10〜20程度)、強くなるようです。

ただこの教師データ、やたら圧縮できていて、元データの1/3ぐらいのファイルサイズになっています。同一局面が大量に含まれているわけではないと思いますが、類似局面が大量に含まれていたりする可能性がなくはないです。教師の生成も難しいですね…。

「月刊教師局面 2018年1月号」への15件のフィードバック

まふ 2018年1月23日 09:54 より:

それは生成した局面の評価値の大きさですよ。

やねさんが配布している
rezeroの評価値ゼロは
圧縮容量８１４KBですよね。

約２億個のパラメタを書き込んだ
評価関数はzipに圧縮すると
だいたい５００MB程度だと思います。

２億で６００倍違いますね。
これが１００億なら１/３と変動しても不思議じゃありません。

ランダムムーブの局面は
とんでもない局面からの分岐が増え、
教師の評価値も当然大きいものになるかと。

まあ、この辺の数値で
etaをチロッと変えると良い感じに。

返信 ↓
- やねうらお 2018年1月23日 09:56 より:
  
  あー、まあ、評価値の絶対値がゼロ付近に密集してるのは、確かにそうかも。しかし、それにしては圧縮が利きすぎているので、他にも要因がありそうな…。
  
  返信 ↓
  - まふ 2018年1月23日 10:12 より:
    
    7zで圧縮した場合だと
    評価値の大きさに加えて、
    シャッフルしたかどうかでも違いますね。
    
    ノーシャッフルだとさらに半分くらいになったりします。
    
    圧縮ソフトによっては、
    圧縮のしやすさとかもあるみたいです。
    
    返信 ↓
    - やねうらお 2018年1月23日 10:23 より:
      
      あー！今回、シャッフルしてませんわ！！
      それで局面が連続してて、圧縮がかかりやすいってことですか…。なるほろ。
      
      返信 ↓
初心者開発 2018年4月16日 13:24 より:

すみません　教師局面一月号のパート3をＣｏｒｅi
７、loop１０でやったのですがどれぐらい時間かかります？一週間で一つもできないのですが・・・

返信 ↓
- やねうらお 2018年4月16日 13:35 より:
  
  40コア(80HT)のPCで100億局面の1周が8〜12時間ぐらいだったような…。4コア(8HT)ですとその10倍程度、loop 10ならそのさらに10倍程度…。
  
  返信 ↓
初心者開発 2018年4月16日 13:41 より:

まじですか・・・ありがとうございます。

返信 ↓
korokoro 2018年7月19日 17:24 より:

どこで書けばいいのか分からないのでここに書きます。
rezero19を公開してくれませんか。

返信 ↓
- やねうらお 2018年7月19日 18:45 より:
  
  他に強い評価関数がたくさんあるので、あまり公開する意義を感じないというか…。> rezero19
  とりま、製品版にはバンドルされてますし > kpp_kkpt型のrezeroの最新版
  
  返信 ↓
  - korokoro 2018年9月16日 19:30 より:
    
    >他に強い評価関数がたくさんあるので、あまり公開する意義を感じないというか…。
    でもrezero特有の指し方が見たいのでどうかお願いします！
    
    返信 ↓
    - やねうらお 2018年9月16日 21:09 より:
      
      一応、rezeroシリーズの最新版(最終版？)が、『将棋神やねうら王』に収録してあるので、まあ、これでいいかなと…。
      
      返信 ↓
weRy 2019年12月1日 17:30 より:

>>32手目でほぼ互角の局面から対局をスタートさせてい
ます。32手目で互角になるようにMultiPVを駆使して
(なるべく互角になる指し手を選びつつ)進めて、そこ
から対局をさせるようなアルゴリズムとなっていま
す。

これって、一般人でも出来ますか？

返信 ↓
- やねうらお 2019年12月2日 03:18 より:
  
  “gensfen2018″コマンドがそういうコードになっています。あまり気にいらなかったので、このコード廃止にしましたけども。
  以下のフォルダに移動させてあるので、これ持ってきてビルドしなおすなりすれば使えます。(プログラミングの知識、多少必要ですけど)
  
  https://github.com/yaneurao/YaneuraOu/blob/master/source/old_engines/gensfen/gensfen2018.cpp
  
  返信 ↓
  - weRy 2019年12月2日 15:01 より:
    
    色々とありがとうございます(v^_^)v
    今c++学んでいるので、ついでといってはなんですが、色々勉強させて頂きます。
    
    返信 ↓
    - やねうらお 2019年12月2日 16:16 より:
      
      はい(｀･ω･´)ｂ
      
      返信 ↓

やねうら王公式サイト

コンピューター将棋やねうら王公式サイト

月刊教師局面 2018年1月号

「月刊教師局面 2018年1月号」への15件のフィードバック

コメントを残すコメントをキャンセル

「月刊教師局面 2018年1月号」への15件のフィードバック

コメントを残す コメントをキャンセル

コメントを残すコメントをキャンセル