フロッピーディスクに収まる評価関数バイナリ公開しました

投稿日時: 2019年1月15日投稿者: やねうらお

NNUE評価関数は、ネットワーク構成を簡単にカスタマイズできるようになっている。

そこで、入力をK(玉のいる升)とP(どの升にどの駒がいるかに対応する値)だけにして(81升 + 1629通り = 1710)、hidden層の1層目を256×2、2層目・3層目を32にして学習させた。(K-P-256-32-32) NNUEを知らない人のために書くと、各層は全結合。

※　補足 : ニューラルネットの入力は、駒が存在するところを1、存在しないところを0とした1710次元のベクトル。

教師はdepth 8で生成した10億局面から学習させてみたところ、elmo – R30程度になった。

ファイルサイズは873KB。(zipで圧縮して400KB程度)
教師をもう少し深いdepthで生成すれば、まだ強くなるはず。

とりあえず公開しておいた。

https://github.com/yaneurao/YaneuraOu/releases/tag/20190115_k-p-256-32-32

elmoと言えば言うまでもなく2017年のWCSC27で優勝したソフトであり、1年半余りの技術的な革新により、これとほぼ同等のものがフロッピーディスクにも収まるサイズになったのってすごくないですか？elmoのおおよそ1/1000っすよ？

しかも、入力がKとPだけってなんですか。hidden層の1層目が256×2しかないので、3駒関係どころか、2駒関係すら表現できているか怪しいというのに…。

従来、小さな評価関数バイナリと言えば、GPS将棋が代表格であり、軽量なので開発のテスト用に使うことが多かった。(『将棋神やねうら王』も開発のテスト時にはGPS将棋を用いていた。) そのGPS将棋よりも断然小さな873KB。今後、GPS将棋をテストに使わずに済みそうだ。

ちなみに、GPS将棋のソースコードはいま見ても驚愕に値する。C++ templateを駆使して書かれた、計算しやすくて効果がありそうな特徴因子をひたすら記述してあり、それを機械学習により学習させていた。特徴因子を考える職人と、C++の達人的プログラマが非常に長い時間をかけて試行錯誤した痕跡がある。

しかし、いまにして思えば、それらは全く無駄な作業であった。なにしろ、何も考えずにKとPを入力にして評価値を出力するような小さなニューラルネットを構成するだけでここまで強くなるのだから…。

過去の技術をその後の歴史を知るものが批評するのはフェアではないことは承知しているが、ここ近年でそれほどの技術革新があったという証左になればと思い、書き留めておく次第である。

「フロッピーディスクに収まる評価関数バイナリ公開しました」への33件のフィードバック

ritomath 2019年1月15日 09:23 より:

質問です
教師局面はどのソフトで生成したか
学習コストはどの程度であったか
強化学習のみに頼った場合、NNUEだけで強化学習するのと、rezero系を強化学習してNNUEの教師にするのではどのように差が出るか（想像でいいです。学習コストの違いやレートの上昇曲線なんかが個人的には気になります）

後記
なんでこんな小さいネットワークでそんな精度が出るんですか！わけわかめです！流石！（褒めている）

返信 ↓
- やねうらお 2019年1月15日 10:04 より:
  
  > 教師局面はどのソフトで生成したか
  
  やねうら王のgensfen2018コマンドで生成しましたが、gensfenコマンドでもそんなに変わらないはず…。
  
  > 学習コストはどの程度であったか
  
  NNUE、OpenBlasを使う実装になっているのですが、Windows版だとここがマルチスレッドにならないようで、1億局面に2時間ぐらいかかります。40億局面回したので80時間かかりました。(他のjobも並列で回しているので良いのですが..)
  
  > 強化学習のみに頼った場合、NNUEだけで強化学習するのと、rezero系を強化学習してNNUEの教師にするのではどのように差が出るか
  
  直感的には自分自身で生成した教師がベストのような気がするのですが、いまのところ、どうもそうでもなさげです..(´ω｀)　深いですね..
  
  返信 ↓
yrks 2019年1月15日 09:52 より:

1MBに満たない評価関数でelmo_wcsc27に⊿R-30とは凄いですね。ラズパイとかでも捗りそう（拡張命令がNNUEと微妙そうなのはおいといて…）

質問というか妄想なのですが、学習オプションと教師局面を同じにしtnk_wcsc28と同じネットワークで学習させた場合、もっと強くなったりするのでしょうか？

返信 ↓
- やねうらお 2019年1月15日 09:59 より:
  
  > tnk_wcsc28と同じネットワークで学習させた場合
  
  256(x2)-32-32ですね。そっちのほうは、elmo + R30程度になります。
  
  返信 ↓
  - yrks 2019年1月23日 21:16 より:
    
    このツリーにぶら下げるべきかよくわからなかったのですが、NNUE K-Pのビルドに躓いたので報告です。
    私もk-p_256x2-32-32で学習させてみようと前の記事(http://yaneuraou.yaneu.com/2018/12/30/nnue%E8%A9%95%E4%BE%A1%E9%96%A2%E6%95%B0%E3%81%AE%E5%AD%A6%E7%BF%92%E6%96%B9%E6%B3%95%E3%81%AB%E3%81%A4%E3%81%84%E3%81%A6/)
    を参考に環境を真似し(Visual studio)、更にオプションでOpenMPを有効にしビルドを試みたのですが、以下のエラーが出てビルドに失敗しました。
    yaneuraou-master\source\eval\nnue\trainer\trainer_feature_transformer.h(94): error C3016: ‘b’: OpenMP ‘for’ ステートメントのインデックス変数は、符号付きの整数型を含んでいなければなりません (ソースファイルをコンパイルしています eval\nnue\evaluate_nnue_learner.cpp)
    yaneuraou-master\source\eval\nnue\trainer\trainer_feature_transformer.h(257): error C3016: ‘j’: OpenMP ‘for’ ステートメントのインデックス変数は、符号付きの整数型を含んでいなければなりません (ソースファイルをコンパイルしています eval\nnue\evaluate_nnue_learner.cpp)
    OpenMPを有効にしてない状態ではビルドが通ったのですが、NNUEはOpenMPはあまり関係ないのでしょうか。
    
    返信 ↓
    - やねうらお 2019年1月23日 23:22 より:
      
      NNUEの学習部はOpenMP使いません(｀･ω･´)ｂ
      OpenBlasで行列計算だけが並列化されています。そのため学習に時間かかるようです。
      
      返信 ↓
      - yrks 2019年1月24日 21:57 より:
        
        むむむ、Shivorayで遊んでるだけの一般人にはOpenMPやらOpenBLASとやらはどこから攻略すれば理解できるのかわからぬ呪文のようです(´д｀)。
        あと調べたらTNKさんが既にOpenMPあまり意味ない旨をﾂｲｰﾖしてました(https://twitter.com/nodchip/status/1000523457342263296)、わざわざ重複して訊いてしまってすいません。
      - やねうらお 2019年1月25日 00:12 より:
        
        OpenBlas →　(主に)行列計算を並列化してくれるライブラリ
        OpenMP → (主に)ループを並列化してくれるライブラリ
        ぐらいの理解でよろしいかと思います。
        
        NNUEはニューラルネットを用いていて、そこには行列計算が使われているので、OpenBlasを使うとお手軽に並列化できるということのようです。
odagaki0621 2019年1月15日 10:54 より:

探索部は既存のnnue用で動作しますか？
ShogiGUIで試しましたが初期化エラーが
表示されストップしました
エンジン設定を変更すれば動きますか？

返信 ↓
- やねうらお 2019年1月15日 11:11 より:
  
  これ用の実行ファイルをビルドする必要があるです。。。
  
  返信 ↓
Ta(ry 2019年1月15日 12:10 より:

そして、みんな必死でフロッピーディスクとドライブを探してそうな件ｗ
私は、Windows Me世代のPCがまだ現役なので、問題なしｗ
製造終了間際に慌てて買い込んだようなフロッピーディスクは、全盛期に製造されたものに比べて、未使用でもうまく読み書きできなくなってしまっている事が多いような気がする。
ついでにMDは、PCのデータ用としての用途に解放するのが遅過ぎて死んだバカメディアだと思ってるｗ取り外したままの状態ではどこかに失くしそうなSDメモリよりも少量データの受け渡しなどに扱いやすそうだったのに。

返信 ↓
- やねうらお 2019年1月15日 16:55 より:
  
  MDではなくMOではなく？MOは大容量化が遅すぎましたね…。
  
  返信 ↓
  - Ta(ry 2019年1月16日 07:27 より:
    
    音楽のMDです。DS-HMD1のようなドライブが一応存在していたらしいｗ
    MOとかDVD-RAMとか、外殻を付けたままドライブに入れるようなメディアは、どれもこれもオフラインで物理的に渡すときに渡しやすいと思うのにｗ
    
    返信 ↓
    - やねうらお 2019年1月16日 07:53 より:
      
      ほほー..MD用のドライブって発売されるのが遅かったせいか(存在自体は知っているものの)私は現物を見たことないです(´ω｀)
      
      返信 ↓
odagaki0621 2019年1月16日 21:02 より:

K-P-256…をPS4等のゲーム機用アプリに移植したら
小銭を稼げるかも（そんな時間がなければ仕方が無いが）

返信 ↓
- やねうらお 2019年1月17日 02:59 より:
  
  いまどきのゲーム機なら普通のNNUEのほうでメモリ的には余裕で足りますね…。今回のやつは、いまどきの炊飯ジャーとか電子レンジに搭載されているCPUで動作するレベルかと。(炊飯ジャーで将棋をする光景はシュールですね)
  
  返信 ↓
odagaki0621 2019年1月17日 09:42 より:

K-P-256…のピーク時のCPU温度は普通のNNUEに比べ
少し位低くなるのですか？

返信 ↓
- やねうらお 2019年1月17日 10:41 より:
  
  今回の評価関数の場合、全体に占める評価関数の計算時間の割合が減るので、評価関数がAVX2の特定の命令を駆使してCPUを極限まで使うNNUEの場合、相対的にCPUへの負荷は下がるのでCPU温度は少し下がるはず…。
  
  返信 ↓
odagaki0621 2019年1月19日 11:31 より:

K-P-256…の棋力がelmo_wcsc27に対して-R30と
紹介されていましたが私のCPUの異なる3台のPCに
1手3秒又は5秒で千局近く対局させましたが何れも
K-P-256…の勝率が55％前後でした　+R30が正当な
勝率ではないでしょうか　私がチェックして感じた
のはCPUがRyzenのPCの方がi7に比べK-P-256…の
勝率が少し良いかないうことでした

返信 ↓
- やねうらお 2019年1月19日 13:36 より:
  
  一応、私のほうでは1000局×1,2,4秒で調査しましたが、まあ、持ち時間や用いる定跡などによって多少の差はあるかも知れないです。
  
  返信 ↓
  - odagaki0621 2019年1月19日 13:41 より:
    
    私の方式はNO Book NO Ponderです
    
    返信 ↓
    - やねうらお 2019年1月19日 13:45 より:
      
      定跡なしですと似た進行になってしまうような…。
      
      返信 ↓
      - odagaki0621 2019年1月19日 18:47 より:
        
        以前は定跡を使用していましたが
        バラツキが大きいので使用を止めて
        います　この方が中盤以降の実力が
        測りやすいと思います
      - やねうらお 2019年1月19日 19:43 より:
        
        横歩取りばかりにならないですか？(^^ゞ
odagaki0621 2019年1月27日 11:00 より:

https://github.com/mizar/YaneuraOu/releases

上記にupされているK-P-256…の探索の中で
一番強いと思われるのはどれですか？

返信 ↓
- やねうらお 2019年1月27日 13:44 より:
  
  全部同じなのでは。(Windows用とAndroid用、評価関数がバンドルされているもの・されていないもの、があるだけで…)
  
  返信 ↓
  - odagaki0621 2019年1月27日 15:34 より:
    
    YaneuraOu-2018-tnk-k-p-msys2-gcc-
    evallearn-avx2
    YaneuraOu-2018-tnk-k-p-msys2-gcc-
    tournament-avx2
    YaneuraOu-2018-tnk-k-p-msys2-gcc-avx2
    YaneuraOu-2018-tnk-k-p-msys2-clang-
    evallearn-avx2
    YaneuraOu-2018-tnk-k-p-msys2-clang-
    tournament-avx2
    YaneuraOu-2018-tnk-k-p-msys2-clang-avx2
    
    avx2版だけでもこれだけありますが具体的に
    違いを教えてもらえれば助かりますが…
    
    返信 ↓
    - やねうらお 2019年1月27日 17:38 より:
      
      evallearnは評価関数の学習用でしょう。tournamentは余分な機能を削いで少しばかりのスピードアップをするバージョンです。
      gccはgccでコンパイルしたもので、clangはclangでコンパイルしたものでしょう。いずれにせよ、ご自分の環境でnpsの出るものを選べば良いのでは…。
      
      返信 ↓
daigotillaの作者 2019年2月8日 10:27 より:

質問ですが、この関数はライブラリとして使えますか？追加学習したものをWCSC29で参加したいと考えてるのですが・・・。

返信 ↓
- やねうらお 2019年2月11日 09:35 より:
  
  やねうら王のGitHubで公開してあるものは、やねうら王ライブラリなのでライブラリとして使えます。(｀･ω･´)ｂ
  なお、本日ぐらいに新しいものを…。
  
  返信 ↓
  - daigotillaの作者 2019年2月11日 17:35 より:
    
    返信ありがとうございます。了解しました！
    
    返信 ↓
48 2019年2月13日 09:09 より:

ルール確認中のおっさんなのでコメントします。
2019年1月15日時点で登録されているライブラリと規定されてますよ。
http://www2.computer-shogi.org/wcsc29/cfp.html
私も最近気づいたんで

返信 ↓
- やねうらお 2019年2月13日 10:37 より:
  
  その「登録」とその後の「アップデート」とは別なのではないでしょうか。(私はそう解釈しています。)
  
  というのも、やねうら王のGitHub自体を数年前にCSAライブラリとして申請して、その後、追加の登録手続きはしていないですし、しかしGitHubのほうはどんどん更新してますし、その更新に対して登録時点のものでなければ使ってはならないということにはなっていないはずで…。
  
  返信 ↓

やねうら王公式サイト

コンピューター将棋やねうら王公式サイト

フロッピーディスクに収まる評価関数バイナリ公開しました

「フロッピーディスクに収まる評価関数バイナリ公開しました」への33件のフィードバック

コメントを残すコメントをキャンセル

「フロッピーディスクに収まる評価関数バイナリ公開しました」への33件のフィードバック

コメントを残す コメントをキャンセル

コメントを残すコメントをキャンセル