AlphaZeroの再現実験として、YSSの山下さん、Bonanzaの保木さん、Ray(囲碁ソフト)の小林祐樹さんのゴールデンコンビがタッグを組んだAobaZeroというソフトがあるのですが、ここ最近は棋力が停滞気味であります。
http://www.yss-aya.com/aobazero/
対して、AlphaZeroのようにDeep Learningを用いている将棋ソフトではあるものの、山岡忠夫さんのdlshogiのほうは、AlphaZeroの再現にはこだわってないようで、C++で高速化したり、終盤用にdf-pnによる詰将棋ルーチンを搭載したり、LeelaChessZero(AlphaZero型のオープンソースのChessのソフト)の改良点を取り込んだり、TensorRTを用いた高速化を行うなど、様々な改良を意欲的にされていて、ずいぶん強くなっているようです。
将棋AIの進捗 その42(TensorRT対応)- TadaoYamaokaの日記
https://tadaoyamaoka.hatenablog.com/entry/2020/04/19/120726
このdlshogi、山岡さんがTesla V100×8枚を使ってfloodgateでテスト対局されたところ、Yashajin_AI(R4300前後のソフト)に二連勝しています。
Tesla V100×1枚の場合、R3800前後のようですので、V100×8枚にすることでnpsが4倍ぐらいになって、R400~600ぐらい上がっているのでしょうか…。凄まじいですね。
棋力的には、いまのやねうら王系のソフトとほぼ並んでるように思います。今年のWCSCは中止になりましたが、このまま棋力が伸び続けると、来年には完全に抜かれそうですね。
ちなみに、Tesla V100というのは、GeForce 2080Tiの4,5倍程度の性能(nps)が出るようなのですが、お値段もそれ相応にします。山岡さんは、今回のテスト対局はAWSを利用されているようです。
ちなみに、AWSでは、p3.16xlargeがV100×8搭載で、Linuxで$26/時間程度。GPUのドライバーの関係か、Windowsのほうが性能が出るそうです。Windowsの場合の料金もLinuxの場合とさほど変わりません。
あと、やねうら王も深層学習版を作ろうかと考え中です。たぶん名前は、「深やねうら王」…。
dlshogiのアピール文みたのですが、elmoとaperyがライブラリ申請してあったのですが、aobazeroのように0から自己対局のみって感じではないんですか?
fg見てる限り序盤の評価値がnnueと全然違くて面白いですよね
AperyはC++化するときに指し手生成などで使っているのでは。elmoは教師生成して学習の比較実験を行うのに使用されていたはず。(なのでなくても困らないはず..)
elmoWCSC28をリーグに加えて強化学習しているとブログに書いてありますね
アピール文には書いてないけど
elmoをリーグに加えるの、本当に効果があるのか謎ですね(^^ゞ
どうせならもう少し強いソフトのほうが良いような…。
gpuを積めば積むほど強くなる様になると、本当に金の戦いになりますね、、、
AWSだと1インスタンスあたりV100×16までで、別のインスタンスのGPU使うのはすこぶる効率が悪そうなので、石油王でもない限りやらないかもです。なのでV100×16で横並びになるような。
今、石油王になっても全く儲かりませんね汗
やねうら王タイプとDLタイプの違いがcpu使うかgpu使うかくらいしかよくわからない‥
使う分にはそれくらいの違いしか…。
中身は全く違うのですけども。(ソースコード、1行も使いまわしてなかったり)
深やねうら王ですか。ゴールデンコンビに対抗して、磯崎さん、ザッカーバーグさん、ビルゲイツさんのコンビで!!
私「(どこの石油王でもいいから、お金だけだしてくれたらええんやで..)」
なんか、石油王が真っ青になってそうな原油の先物の価格w
私が子供のころに聞いた、「石油は30年後に枯渇する」とは何だったんでしょうかね
※ 「可採年数(現在見つかっている石油)が30年」ということかな。
なんか、枯渇するからと価格を吊り上げられると、高コストでも石油が出ないと思われていた場所から石油を掘り出せる技術でペイできてしまうとか、息を吐きたかったら石油を使うなみたいな二酸化炭素の排出権で使用量が減ってるとか、そのあたりのバランスでどんどん増えてるような雰囲気っぽいですね。
◆油田発見
https://ja.wikipedia.org/wiki/%E6%B2%B9%E7%94%B0%E3%81%AE%E4%B8%80%E8%A6%A7
見ると1990年以降もちょろっと油田が見つかっているようです。
◆原子力発電
https://ja.wikipedia.org/wiki/%E6%97%A5%E6%9C%AC%E3%81%AE%E5%8E%9F%E5%AD%90%E5%8A%9B%E7%99%BA%E9%9B%BB%E6%89%80
見ると1990年以降もちょろっと原発作っています
◆火力発電
https://ja.wikipedia.org/wiki/%E7%81%AB%E5%8A%9B%E7%99%BA%E9%9B%BB%E6%89%80
ここの石炭火力発電所
技術が進歩して石炭でもいい感じで発電するようになってきたみたい
◆シェール革命
最大の理由はシェール革命。
「インターネット革命」に匹敵する革命と言われる「シェール革命」
以下参照
https://www.youtube.com/watch?v=QI24pHb0bA8
へぇへぇへぇー!シェール革命、勉強になりますた。
WCSC30、開催中止 代わりに「世界コンピュータ将棋オンライン大会」を実施らしいですね。
dlshogiが本命か?
まあ、R4300〜4400程度だとしたら、やねうら王をAWSでクラスター組んで動かしたほうがやや強いでしょうけども…。(今回、誰かがクラスターを組むかどうかは知りません)
p3.16xlargeで8枚ですね。16枚のインスタンスってありましたっけ?
あれ?そうなんですか。勘違いしてました!ご指摘感謝いたします。記事修正しときます。
大そうなGPUを動員してnnueに勝っても”dlshogi強すぎ”とは思わない
RTX2080Ti1枚で勝ったら”なかなかやるな”と思うが
まあ、WCSC29のときはNNUE勢も、AWS 10インスタンスぐらい借りてましたので、まあ、WCSCはそういう大会かと(^^ゞ
来年の大会までやねうら王2除いてコンピュータ将棋はお休みですか?
NNUEも停滞&飽きてきたのでやねさんには期待してます
新しい評価関数を作って、お披露目したいのですけど、大会前にそれをやるとそこから学習を回すのがうまい人が優勝しかねないですね(´;ω;`)
まあ、考えておきます。
公開は大会後でもいいので是非とも是非ともやっていただきたいです!!
(`・ω・´)b かんがえときます..
とても期待して待っておりやす御師匠
オンラインとはなりましたが、いつものように優勝候補、面白そうなチーム予想などしてもらいたいです
私は新興勢力としてはdlshogiぐらいしかわかりません
標題と直接関係ないことなので恐縮ですが やねさんの
意見をお聞きしたいのでPC将棋スレよりコピペします
apery_wcsc30は結構強いが相変わらずエンジン設定で
Resign(投了値)の項目が無い 項目の簡素化はいいこと
だと思うがResignは設定できるようにしてほしい
まあ、趣味で開発している開発者は普通は誰かに使ってもらうために開発しているわけではなく、他の開発者の参考になるようにソースコード公開しておくので使いたければ勝手に使えば?ぐらいの温度感なので、平岡さんにあれもこれも要望するのはどうかと思ったりも…。