dlshogi強すぎクソワロタ

投稿日時: 2020年4月20日投稿者: やねうらお

AlphaZeroの再現実験として、YSSの山下さん、Bonanzaの保木さん、Ray(囲碁ソフト)の小林祐樹さんのゴールデンコンビがタッグを組んだAobaZeroというソフトがあるのですが、ここ最近は棋力が停滞気味であります。

対して、AlphaZeroのようにDeep Learningを用いている将棋ソフトではあるものの、山岡忠夫さんのdlshogiのほうは、AlphaZeroの再現にはこだわってないようで、C++で高速化したり、終盤用にdf-pnによる詰将棋ルーチンを搭載したり、LeelaChessZero(AlphaZero型のオープンソースのChessのソフト)の改良点を取り込んだり、TensorRTを用いた高速化を行うなど、様々な改良を意欲的にされていて、ずいぶん強くなっているようです。

将棋AIの進捗その42(TensorRT対応)- TadaoYamaokaの日記
https://tadaoyamaoka.hatenablog.com/entry/2020/04/19/120726

このdlshogi、山岡さんがTesla V100×8枚を使ってfloodgateでテスト対局されたところ、Yashajin_AI(R4300前後のソフト)に二連勝しています。

Tesla V100×1枚の場合、R3800前後のようですので、V100×8枚にすることでnpsが4倍ぐらいになって、R400～600ぐらい上がっているのでしょうか…。凄まじいですね。

棋力的には、いまのやねうら王系のソフトとほぼ並んでるように思います。今年のWCSCは中止になりましたが、このまま棋力が伸び続けると、来年には完全に抜かれそうですね。

ちなみに、Tesla V100というのは、GeForce 2080Tiの4,5倍程度の性能(nps)が出るようなのですが、お値段もそれ相応にします。山岡さんは、今回のテスト対局はAWSを利用されているようです。

ちなみに、AWSでは、p3.16xlargeがV100×8搭載で、Linuxで$26/時間程度。GPUのドライバーの関係か、Windowsのほうが性能が出るそうです。Windowsの場合の料金もLinuxの場合とさほど変わりません。

あと、やねうら王も深層学習版を作ろうかと考え中です。たぶん名前は、「深やねうら王」…。

「dlshogi強すぎクソワロタ」への31件のフィードバック

tac 2020年4月20日 17:03 より:

dlshogiのアピール文みたのですが、elmoとaperyがライブラリ申請してあったのですが、aobazeroのように0から自己対局のみって感じではないんですか？
fg見てる限り序盤の評価値がnnueと全然違くて面白いですよね

返信 ↓
- やねうらお 2020年4月20日 17:06 より:
  
  AperyはC++化するときに指し手生成などで使っているのでは。elmoは教師生成して学習の比較実験を行うのに使用されていたはず。(なのでなくても困らないはず..)
  
  返信 ↓
  - tns 2020年4月20日 17:47 より:
    
    elmoWCSC28をリーグに加えて強化学習しているとブログに書いてありますね
    アピール文には書いてないけど
    
    返信 ↓
    - やねうらお 2020年4月20日 18:02 より:
      
      elmoをリーグに加えるの、本当に効果があるのか謎ですね(^^ゞ
      どうせならもう少し強いソフトのほうが良いような…。
      
      返信 ↓
korokoro 2020年4月20日 17:54 より:

gpuを積めば積むほど強くなる様になると、本当に金の戦いになりますね、、、

返信 ↓
- やねうらお 2020年4月20日 17:59 より:
  
  AWSだと1インスタンスあたりV100×16までで、別のインスタンスのGPU使うのはすこぶる効率が悪そうなので、石油王でもない限りやらないかもです。なのでV100×16で横並びになるような。
  
  返信 ↓
  - korokoro 2020年4月22日 10:36 より:
    
    今、石油王になっても全く儲かりませんね汗
    
    返信 ↓
初心者 2020年4月20日 19:38 より:

やねうら王タイプとDLタイプの違いがcpu使うかgpu使うかくらいしかよくわからない‥

返信 ↓
- やねうらお 2020年4月21日 00:29 より:
  
  使う分にはそれくらいの違いしか…。
  中身は全く違うのですけども。(ソースコード、1行も使いまわしてなかったり)
  
  返信 ↓
りちゃ 2020年4月20日 22:26 より:

深やねうら王ですか。ゴールデンコンビに対抗して、磯崎さん、ザッカーバーグさん、ビルゲイツさんのコンビで！！

返信 ↓
- やねうらお 2020年4月21日 00:30 より:
  
  私「(どこの石油王でもいいから、お金だけだしてくれたらええんやで..)」
  
  返信 ↓
  - Ta(ry 2020年4月21日 07:25 より:
    
    なんか、石油王が真っ青になってそうな原油の先物の価格ｗ
    
    返信 ↓
    - やねうらお 2020年4月21日 09:24 より:
      
      私が子供のころに聞いた、「石油は30年後に枯渇する」とは何だったんでしょうかね
      
      ※　「可採年数(現在見つかっている石油)が30年」ということかな。
      
      返信 ↓
      - Ta(ry 2020年4月21日 13:37 より:
        
        なんか、枯渇するからと価格を吊り上げられると、高コストでも石油が出ないと思われていた場所から石油を掘り出せる技術でペイできてしまうとか、息を吐きたかったら石油を使うなみたいな二酸化炭素の排出権で使用量が減ってるとか、そのあたりのバランスでどんどん増えてるような雰囲気っぽいですね。
      - りちゃ 2020年4月24日 22:43 より:
        
        ◆油田発見
        https://ja.wikipedia.org/wiki/%E6%B2%B9%E7%94%B0%E3%81%AE%E4%B8%80%E8%A6%A7
        見ると1990年以降もちょろっと油田が見つかっているようです。
        
        ◆原子力発電
        https://ja.wikipedia.org/wiki/%E6%97%A5%E6%9C%AC%E3%81%AE%E5%8E%9F%E5%AD%90%E5%8A%9B%E7%99%BA%E9%9B%BB%E6%89%80
        見ると1990年以降もちょろっと原発作っています
        
        ◆火力発電
        https://ja.wikipedia.org/wiki/%E7%81%AB%E5%8A%9B%E7%99%BA%E9%9B%BB%E6%89%80
        ここの石炭火力発電所
        技術が進歩して石炭でもいい感じで発電するようになってきたみたい
        
        ◆シェール革命
        最大の理由はシェール革命。
        「インターネット革命」に匹敵する革命と言われる「シェール革命」
        以下参照
        https://www.youtube.com/watch?v=QI24pHb0bA8
      - やねうらお 2020年4月25日 13:05 より:
        
        へぇへぇへぇー！シェール革命、勉強になりますた。
りちゃ 2020年4月21日 21:32 より:

WCSC30、開催中止　代わりに「世界コンピュータ将棋オンライン大会」を実施らしいですね。

dlshogiが本命か？

返信 ↓
- やねうらお 2020年4月22日 10:21 より:
  
  まあ、R4300〜4400程度だとしたら、やねうら王をAWSでクラスター組んで動かしたほうがやや強いでしょうけども…。(今回、誰かがクラスターを組むかどうかは知りません)
  
  返信 ↓
48 2020年4月24日 17:29 より:

p3.16xlargeで8枚ですね。16枚のインスタンスってありましたっけ？

返信 ↓
- やねうらお 2020年4月25日 10:09 より:
  
  あれ？そうなんですか。勘違いしてました！ご指摘感謝いたします。記事修正しときます。
  
  返信 ↓
odagaki0621 2020年4月24日 18:34 より:

大そうなGPUを動員してnnueに勝っても”dlshogi強すぎ”とは思わない
RTX2080Ti1枚で勝ったら”なかなかやるな”と思うが

返信 ↓
- やねうらお 2020年4月25日 10:11 より:
  
  まあ、WCSC29のときはNNUE勢も、AWS 10インスタンスぐらい借りてましたので、まあ、WCSCはそういう大会かと(^^ゞ
  
  返信 ↓
bein& 2020年4月28日 00:36 より:

来年の大会までやねうら王2除いてコンピュータ将棋はお休みですか？
NNUEも停滞&飽きてきたのでやねさんには期待してます

返信 ↓
- やねうらお 2020年4月28日 11:23 より:
  
  新しい評価関数を作って、お披露目したいのですけど、大会前にそれをやるとそこから学習を回すのがうまい人が優勝しかねないですね(´；ω；｀)
  まあ、考えておきます。
  
  返信 ↓
  - loco 2020年4月28日 22:34 より:
    
    公開は大会後でもいいので是非とも是非ともやっていただきたいです！！
    
    返信 ↓
    - やねうらお 2020年4月29日 12:31 より:
      
      (｀･ω･´)ｂかんがえときます..
      
      返信 ↓
  - ドッグ 2020年5月23日 12:04 より:
    
    とても期待して待っておりやす御師匠
    
    返信 ↓
将棋pc 2020年4月29日 21:25 より:

オンラインとはなりましたが、いつものように優勝候補、面白そうなチーム予想などしてもらいたいです

返信 ↓
- やねうらお 2020年4月29日 22:29 より:
  
  私は新興勢力としてはdlshogiぐらいしかわかりません
  
  返信 ↓
odagaki0621 2020年5月1日 11:44 より:

標題と直接関係ないことなので恐縮ですがやねさんの
意見をお聞きしたいのでPC将棋スレよりコピペします

apery_wcsc30は結構強いが相変わらずエンジン設定で
Resign(投了値)の項目が無い　項目の簡素化はいいこと
だと思うがResignは設定できるようにしてほしい

返信 ↓
- やねうらお 2020年5月1日 19:24 より:
  
  まあ、趣味で開発している開発者は普通は誰かに使ってもらうために開発しているわけではなく、他の開発者の参考になるようにソースコード公開しておくので使いたければ勝手に使えば？ぐらいの温度感なので、平岡さんにあれもこれも要望するのはどうかと思ったりも…。
  
  返信 ↓

やねうら王公式サイト

コンピューター将棋やねうら王公式サイト

dlshogi強すぎクソワロタ

「dlshogi強すぎクソワロタ」への31件のフィードバック

コメントを残すコメントをキャンセル

「dlshogi強すぎクソワロタ」への31件のフィードバック

コメントを残す コメントをキャンセル

コメントを残すコメントをキャンセル