DL系の将棋ソフトは何故CPUだけで動かすと弱いのですか？

投稿日時: 2021年5月11日投稿者: やねうらお

囲碁ソフト(例えばKataGoや『天頂の囲碁』(マイナビ))は、CPUで動かしてもそこそこ強いらしい。それに比べて、DL(Deep Learning)を用いている将棋ソフトはCPUで動かすと何故こんなに弱いのか(※ ただしトッププロよりは強い)という質問というか罵声というか、ときには言葉の暴力みたいなのがやってくる。中には、KataGoみたいにopcl(OpenCL)を使わないから弱いんだろ、将棋の開発者は開発を怠っている、みたいな意見があったり、「将棋の開発者が開発にお金をかけないのが悪い。やねさんのお小遣いでやったぐらいでおっつかないだろ」みたいに言う人もいる。

これらについて手短に回答を書いておく。

機械学習の時だけGPUを使うのではないかと勘違いをしている人がいるけども、実際の対局中もGPUをガンガン使う。ガンガン使ったほうがたくさんの局面が読める。CPUで動かすと読める局面の数はGPUの時の1/10ぐらいになる。下手すると1/100ぐらいかも知れない。ともかく読める局面数は桁違いに減る。

それでどれくらい弱くなるかというと将棋の場合、探索局面数が2倍でR130程度強くなる。逆に探索局面数が1/2になるとR130ぐらい弱くなる。1/16ならその4倍でR130×4 = R520程度であるな。それだけ弱くなる。

囲碁の場合、どれくらい弱くなるのかはデータがないのでよくわからないけども、聞いた感じだと、囲碁の場合もそれくらいは弱くなるようだ。

では、それで何故囲碁のほうはCPUだけでもそんなに強いのかと言うと、元が強いからだ。GPUを使った時の強さが(トッププロを基準として)、将棋の場合より+R500以上違いがあるはず。なのでCPUで動かして、それによってR520弱くなろうと、人間からすると(トッププロと)+R1000以上離れてることになる。そりゃつえーわ。

それとは別の要因として、ブロック数を増やした時の棋力の伸びの違いが挙げられる。

DL系の囲碁や将棋ソフトで用いているモデルの構造は、ResNetと言うのだが(囲碁ではこれを改良したものも使われ始めている)、このブロック数(≒層の数)が多いほど大局観が良くなるとされている。ブロック数を2倍にするとnps(探索速度≒1秒間に読める局面の数)は、1/2になる。つまり、ブロック数を2倍にすると探索速度からするとR130ほど弱くなるわけである。その代わりに、大局観は格段に良くなるので、その分、良い指し手が指せるならこの損した分を取り戻せるわけである。

囲碁では、2倍のブロック数にした時に(同じ局面数を探索した時の比較で)+R200～R500ぐらい上がるとも言われている。
// 正確な数字はよく知らないので詳しい人、コメント欄でフォローお願いします。

+R200だとしてもnpsダウンで-R130弱くなる分より大きいのでブロック数は大きくしたほうが得である。そんなわけで囲碁では(KataGoなど)どんどん大きなモデルの学習を行うのがトレンドになっている。

// ブロック数に比例して学習時間は増えるし、ブロック数に比例して学習に要する教師の数も増えるので、ブロック数をN倍にすると学習に要するコストはNの2乗倍近くになる。

将棋では、残念ながら10b(10ブロック)から20bに増やすとnpsが低下した分を回収できないようで(いまのところ)弱くなるようだ。

まあ、将棋の場合、大局観が良くなったところで、33手詰めを食らえばそれまでだし、大局観で詰みが回避できるわけでもないので、読みの量が減るのは良くないのであろう。

そんなわけで、将棋ではブロック数を増やして強くする、みたいなことが出来ていない。ここが囲碁と決定的に異なる点。

また、将棋で使っているモデルは、いまのところたったの10bが主流なので強化学習は早い段階でサチる(飽和する)し、囲碁ほど大きな計算資源を要求されるわけではない。「やねさんのお小遣い(いくら？)でやったぐらいでおっつかない」はたぶん誤り。将棋の場合、3080Ti 10基もあれば十分だと思う。(0からやっても3080Ti×10基×半年とかでサチると思う)

あと、冒頭で触れたOpenCLについだけども、将棋の場合もふかうら王(dlshogi互換エンジンのやねうら王)はTensorRT版だけではなく、CPU版とDirectML版、CUDA版を公開している。これらは、OpenCLに比べてパフォーマンスが劣っているわけではないと思うので、「OpenCLを使っていないから弱い」みたいな言説は誤り。

// ただ、KataGoはOpenCLに合わせてかなりチューニングしてあるらしいですが。

「DL系の将棋ソフトは何故CPUだけで動かすと弱いのですか？」への14件のフィードバック

生田弘樹 2021年5月11日 12:56 より:

ありがとうございました。ビジネスを考えなければ、トップをただ単純に目指すものでしょうし、そこにDLで、GPUをぶん回してトップが見えるものなら、それを目指すことを否定できないですね。実際alphaZero(囲碁)で、先読みにもテンソルフロウ（？）を使っているような記述も見たような気がします。
ただ、実際のビジネスを見据えたソフトをより多くのユーザに提供しようとすると、消費電力と強さのトレードオフは必要な気がします。うーん、私の個人的見解ですが、対局時のGPU使用は商用可能なマシンに絞ってほしいですね。それが将棋ファンとしての私の希望です。GPUはＭ１縛りをするとか。（超個人的な見解なので、無視してくださいませ）では、私の疑問に答えてくださりありがとうございました。

返信 ↓
- やねうらお 2021年5月12日 04:54 より:
  
  現在、ふかうら王、RTX3090でfloodgate R4250程度。(3990X 水匠がR4400程度)。あとR150ほどなんですけどね…。
  // 年内には超えるのではないかと…。
  
  返信 ↓
りちゃ 2021年5月11日 19:02 より:

GT710 ¥3516あたりで「これがdlパワーか！イェ～イ」ができるかどうか・・・dlはgpuと相性がいいので、4000円くらい出せばいいのにと思う。

返信 ↓
- やねうらお 2021年5月12日 05:03 より:
  
  GT710でもおそらく1knps(1000nps)ぐらい出て、800poでR3200程度なので、R3500前後の強さであるはず。
  
  返信 ↓
  - りちゃ 2021年5月12日 07:32 より:
    
    CPUでdl将棋動かすとRだいたいどのくらいでしょうか？
    【ケースA】Threadripperみたいな１セット買うと８０万円くらいのPC
    【ケースB】i7とかRyzen 7とか２０万円以下で買えるデスクトップPC
    【ケースC】 i3 1005G1くらいの７万円レベルのノートPC
    
    返信 ↓
Mac 2021年5月12日 02:55 より:

https://xtech.nikkei.com/atcl/nxt/column/18/00138/042100271/

囲碁の方が将棋より人間と差があるって本当なの？
古い記事だから現在のRは知らないけど、AlphaGo Zeroはもう開発してないし、現在は絶芸が最強でAlphaGo Zeroを越えただろうと言われているレベルだから人間のトップに＋1500～2000くらいなのではないの？囲碁はフリーで手に入らないから正確なRがわからないけど、将棋の場合も人間との差は似たようなものでは？囲碁ソフトの方がまれにシチョウや死活を見逃すような人間の目でもわかる大悪手がまだある気もするし。

返信 ↓
- やねうらお 2021年5月12日 05:06 より:
  
  floodgateで現在最強のソフトが(対局回数100回以上に限ると)R4400前後。トッププロがR3300-3500付近(24換算R3100-3300)。トッププロと最強ソフトとの差はR900-R1100程度。
  
  返信 ↓
  - Mac 2021年5月16日 01:40 より:
    
    floodgateで現在最強のソフトが(対局回数100回以上に限ると)R4400前後ってハードの性能が低いからでは？囲碁AIのレーティングはハードも最高のものを使ったときの話だから将棋だってコンピュータ将棋選手権レベルのハードを使えば4400なんて軽く超えるでしょう。
    
    返信 ↓
    - やねうらお 2021年5月16日 11:14 より:
      
      floodgateの上位陣は、V100×8(推論に関してはA100×8とほぼ同性能)と高級スリッパ(3990X)なのでWCSCの決勝日とほぼ同スペックですよ。そのスペックでR4400しか行ってないんです。
      
      返信 ↓
      - Mac 2021年5月22日 07:56 より:
        
        https://yaneuraou.yaneu.com/2019/05/16/%E4%BB%8A%E5%B9%B4%E3%81%AEwcsc29%E3%81%AE%E4%B8%8A%E4%BD%8D%E3%82%BD%E3%83%95%E3%83%88%E3%81%AFalphazero%E3%82%92%E8%B6%85%E3%81%88%E3%81%9F%E3%81%AE%E3%81%A7%E3%81%99%E3%81%8B%EF%BC%9F/
        
        https://yaneuraou.yaneu.com/2019/04/14/%e6%9c%80%e6%96%b0%e3%81%ae%e5%b0%86%e6%a3%8b%e3%82%bd%e3%83%95%e3%83%88%e3%81%8c%ef%bc%92%e6%89%8b%e7%9b%ae%ef%bc%93%ef%bc%94%e6%ad%a9%e3%82%92%e6%82%aa%e6%89%8b%e3%81%a0%e3%81%a8%e8%a8%80%e3%81%84/
        
        2年前にこのようなことを書いていて、大会ごと（半年ごと）にR＋300くらい強くなっていると毎回おっしゃっていますが、未だに4300なのですか？
      - やねうらお 2021年5月23日 14:11 より:
        
        floodgate、DL系のソフトが下位ソフトにわりと一発食らうのでレーティングがぐちゃぐちゃになっている意味もあります。
        // 体感的には以前の4500が4300ぐらいになってます。
  - Mac 2021年5月16日 01:56 より:
    
    あと24換算ってどういう情報をもとに出しているのですか？昔こんなことつぶやいてましたが変わったのですか？
    
    https://twitter.com/yaneuraou/status/703921301451206657
    
    返信 ↓
    - やねうらお 2021年5月16日 11:16 より:
      
      基準ソフトがいくつかあって、そのソフト相対でざっくりと計算されてます。…が、基準ソフトのレートが低いので上のほうのレートはいい加減だったりします。
      
      返信 ↓
      - Mac 2021年5月22日 07:48 より:
        
        https://www.uuunuuun.com/single-post/2018/09/07/%E3%83%AC%E3%83%BC%E3%83%86%E3%82%A3%E3%83%B3%E3%82%B0%E3%81%8B%E3%82%89%E8%A6%8B%E3%82%8B%E5%B0%86%E6%A3%8B%E3%82%BD%E3%83%95%E3%83%88%E3%81%AE%E5%8A%87%E7%9A%84%E9%80%B2%E6%AD%A9%E3%81%AB%E3%81%A4%E3%81%84%E3%81%A6
        
        私が知る限りフラゲR＋200＝24Rってイメージですが

やねうら王公式サイト

コンピューター将棋やねうら王公式サイト

DL系の将棋ソフトは何故CPUだけで動かすと弱いのですか？

「DL系の将棋ソフトは何故CPUだけで動かすと弱いのですか？」への14件のフィードバック

コメントを残すコメントをキャンセル

「DL系の将棋ソフトは何故CPUだけで動かすと弱いのですか？」への14件のフィードバック

コメントを残す コメントをキャンセル

コメントを残すコメントをキャンセル