WCSC31直前レポート

WCSC31(第31回世界コンピュータ将棋選手権)はオンラインで開催されることが決定しています。当日はプロ棋士の方々による棋譜解説があるらしいです。

今回の大会ではDeep Learning勢が席巻するのではないかと私は予想していたのですが、どうもDeep Learning勢の鬨の声(?)が聴こえてきません。うちのチームも学習があまりうまく行ってない感じではあります。

ふかうら王(やねうら王のDeep Learning版)は、dlshogiをベースにしているのですが、Deep Learningのmodelを学習させる学習部はまだ実装していないのでdlshogiの学習部をそのまま使って学習をさせています。dlshogiの学習部はまだ発展途上にあって、多くの改良が現在進行形でなされていると同時に、発展途上であるが故に、罠も数多く潜んでいます。

Discordで、dlshogiの作者の山岡さんやGCTチームの加納さんに教えていただきながら(機械)学習を進めていますが、本家GCTチームもあまりうまく学習が回せているとは言い難く、(ResNetの)20ブロックで生成した教師の質がよくなかったそうで、生成した教師を破棄したなどとも仰っていました。

まあ、本家が学習に試行錯誤しているような状況なので他のチームの状況もさもありなんと言った感じです。

ResNetのブロック数とチャンネル数(フィルター数)をドロップダウンで選んで、開始ボタンを押し、あとはじゃぶじゃぶ課金するだけでさいつよ(最強)になれば良いのでしょうけども、いまのところ、そんな簡単な話ではなさそうです。だからこそ(modelファイルの)育成にゲーム性があって面白いのかも知れませんが…。

本ブログで、dlshogiの自己対局で学習を回している人向けに、ノウハウを大放出しようと思っていたのですが、弊チームもあまりうまく学習を回せてないような状況なので、WCSC31の大会が終わってからにしたいと思います。

電竜戦予行#5について

ちなみに先日行われた電竜戦予行#5で、弊チームが弱すぎワロタな状態だったのは、GCPでA100を借りようと思っていたら、GCPのGPU貸し出し制限緩和の申請が通らなかったため、弊チームのMizarさんが手持ちのRTX 3090+2080Sで出場したからです。(WCSC31本番ではAWS借りる予定です。)

// GCPは一度請求が発生して以降でないとこの申請が通らないようです。そもそもGPUを使いたいわけで、GPUを使うためにGPUが使えないインスタンスを無駄に使用して請求を発生させなくてはならないのはおかしいような気が…。

加納さんが育てているmodelが強すぎる件

GCTの加納さんが育てているmodel(10ブロックのResNet)がGeForce RTX2080Tiという型落ちのGPU 1枚でfloodgate、わりと上位にいます。RTX 3090で動かした場合、スリッパ(AMD Ryzen Threadripper 3990X)で動かす従来ソフトと互角ぐらいのところに来るのかも知れません。

// 今後将棋ソフトのためにPCを買うなら、GPUにお金をかけるほうがコスパが良さそうです…。

WCSC31直前レポート」への5件のフィードバック

    • 前者はたややんさんが個人的に育てているモデル(たややんさんが放流)で、後者は、弊チームで育てているモデル(Mizarさんが放流)ではないかと。

  1. >> 本家が学習に試行錯誤しているような状況なので

    人間の脳みそってなんだかんだいって上手いこと学習してるよなぁ。どこが違うんだろうか?

    • 人間の脳みその場合も、将棋が上達する人としない人との差がわりとあるので、上手いこと学習できない人のほうが多いのではないかと…。

      • やねさんだってきっと数学的スキルがベースにあって、で将棋が上達したんだと思うから、コンピュータ将棋も、まず先に算数を学習・・・知らんけど

やねうらお へ返信する コメントをキャンセル

メールアドレスが公開されることはありません。 が付いている欄は必須項目です