dlshogi強すぎクソワロタ

AlphaZeroの再現実験として、YSSの山下さん、Bonanzaの保木さん、Ray(囲碁ソフト)の小林祐樹さんのゴールデンコンビがタッグを組んだAobaZeroというソフトがあるのですが、ここ最近は棋力が停滞気味であります。


http://www.yss-aya.com/aobazero/

対して、AlphaZeroのようにDeep Learningを用いている将棋ソフトではあるものの、山岡忠夫さんのdlshogiのほうは、AlphaZeroの再現にはこだわってないようで、C++で高速化したり、終盤用にdf-pnによる詰将棋ルーチンを搭載したり、LeelaChessZero(AlphaZero型のオープンソースのChessのソフト)の改良点を取り込んだり、TensorRTを用いた高速化を行うなど、様々な改良を意欲的にされていて、ずいぶん強くなっているようです。

将棋AIの進捗 その42(TensorRT対応)- TadaoYamaokaの日記
https://tadaoyamaoka.hatenablog.com/entry/2020/04/19/120726

このdlshogi、山岡さんがTesla V100×8枚を使ってfloodgateでテスト対局されたところ、Yashajin_AI(R4300前後のソフト)に二連勝しています。

Tesla V100×1枚の場合、R3800前後のようですので、V100×8枚にすることでnpsが4倍ぐらいになって、R400~600ぐらい上がっているのでしょうか…。凄まじいですね。

棋力的には、いまのやねうら王系のソフトとほぼ並んでるように思います。今年のWCSCは中止になりましたが、このまま棋力が伸び続けると、来年には完全に抜かれそうですね。

ちなみに、Tesla V100というのは、GeForce 2080Tiの4,5倍程度の性能(nps)が出るようなのですが、お値段もそれ相応にします。山岡さんは、今回のテスト対局はAWSを利用されているようです。

ちなみに、AWSでは、p3.16xlargeがV100×8搭載で、Linuxで$26/時間程度。GPUのドライバーの関係か、Windowsのほうが性能が出るそうです。Windowsの場合の料金もLinuxの場合とさほど変わりません。

あと、やねうら王も深層学習版を作ろうかと考え中です。たぶん名前は、「深やねうら王」…。

31 thoughts on “dlshogi強すぎクソワロタ

  1. dlshogiのアピール文みたのですが、elmoとaperyがライブラリ申請してあったのですが、aobazeroのように0から自己対局のみって感じではないんですか?
    fg見てる限り序盤の評価値がnnueと全然違くて面白いですよね

    • AperyはC++化するときに指し手生成などで使っているのでは。elmoは教師生成して学習の比較実験を行うのに使用されていたはず。(なのでなくても困らないはず..)

      • elmoWCSC28をリーグに加えて強化学習しているとブログに書いてありますね
        アピール文には書いてないけど

  2. やねうら王タイプとDLタイプの違いがcpu使うかgpu使うかくらいしかよくわからない‥

  3. 深やねうら王ですか。ゴールデンコンビに対抗して、磯崎さん、ザッカーバーグさん、ビルゲイツさんのコンビで!!

  4. WCSC30、開催中止 代わりに「世界コンピュータ将棋オンライン大会」を実施らしいですね。

    dlshogiが本命か?

    • まあ、R4300〜4400程度だとしたら、やねうら王をAWSでクラスター組んで動かしたほうがやや強いでしょうけども…。(今回、誰かがクラスターを組むかどうかは知りません)

  5. 大そうなGPUを動員してnnueに勝っても”dlshogi強すぎ”とは思わない
    RTX2080Ti1枚で勝ったら”なかなかやるな”と思うが

  6. 来年の大会までやねうら王2除いてコンピュータ将棋はお休みですか?
    NNUEも停滞&飽きてきたのでやねさんには期待してます

  7. オンラインとはなりましたが、いつものように優勝候補、面白そうなチーム予想などしてもらいたいです

  8. 標題と直接関係ないことなので恐縮ですが やねさんの
    意見をお聞きしたいのでPC将棋スレよりコピペします

    apery_wcsc30は結構強いが相変わらずエンジン設定で
    Resign(投了値)の項目が無い 項目の簡素化はいいこと
    だと思うがResignは設定できるようにしてほしい

    • まあ、趣味で開発している開発者は普通は誰かに使ってもらうために開発しているわけではなく、他の開発者の参考になるようにソースコード公開しておくので使いたければ勝手に使えば?ぐらいの温度感なので、平岡さんにあれもこれも要望するのはどうかと思ったりも…。

ドッグ へ返信する コメントをキャンセル

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です