WCSC31にはDL勢しか決勝日に残らない(予言)

やねうら王の定跡生成のためにMCTS(モンテカルロ木探索)の探索部書いてたんですよ。まあ、半日ぐらいでだいたい書けて、ふと思ったんです。あれ?これ、dlshogiの評価関数呼び出せるようにしたら、dlshogiなんじゃね?と。

dlshogiの評価関数を呼び出すコードは、dlshogiからコピペしてくるだけで済みます。dlshogiのC++版は指し手生成などAperyのコードを利用しています。それゆえ、特徴量などはAperyと同じ駒番号(BonaPiece)になっていると思うので、この部分は、やねうら王と全く同じです。

ということは、dlshogiのコード、コピペしてくればdlshogiの評価関数が呼び出せるということです。MCTS + dlshogiの評価関数 = dlshogiです。dlshogiを半日で作った(移植した?)男、爆誕です!

// 学習部も何もないので、語弊がある。あとで山岡さんに叱られる。
// 今回書いたMCTSは、定跡生成用なので探索部としてはそのままは使えない。

MCTSの探索部を書いたあと、dlshogiはどうやってるんだろうとdlshogiのソースコードチラ見したら、あー、このコード、あんまり良くないなと。これなら余裕でR300ぐらい上がるわと思ったんです。

それでまあ、山岡さんに改善点をお伝えして、それらのいくつかは、dlshogiに取り込まれる(かも知れない)ことになりました。

https://twitter.com/yaneuraou/status/1335490566230999043

簡単に言うと、今回の電竜戦で優勝したGCTとdlshogiチームはそれぞれAWSでA100×8のインスタンスを借りたそうなんですけど、GPUの負荷率が30%ぐらいでしかないのだそうです。CPU側でGPUに渡すための局面を用意するのが間に合ってなくてGPUが使い切れていないわけです。

私のアイデアなら、このGPUの使用率を100%近くにできます。そうすると3倍ぐらいnps(探索速度)が出ることになるのでそれだけで+R300ぐらい上がります。他にもdlshogiにはいくつか大きめの問題がある(あった)のですけど、まあそれらも合わせるともっとレートが上がります。

それら以外の改良や評価関数の学習等、すべて合わせるとdlshogiは半年後に+R500ぐらいになっててもおかしくないです。今回の電竜戦ですらやねうら王チルドレンは苦戦したのに、+R500になって勝てる見込みあります?どう考えてもこんなの無理ゲーでしょ。

というか、やねうら王を+R20強くするより、dlshogiを+R300強くするほうが私には遥かに容易いわけですよ。

そんなわけで、来年のWCSC31は決勝日にDL勢しか残らないのではないかと…。

// AWS、A100×8のインスタンス、全チームで取り合いになるのでは…。(このインスタンスは、研究目的でないと借りられないとか何とか)

WCSC31にはDL勢しか決勝日に残らない(予言)」への9件のフィードバック

  1. A100×8のインスタンスは、研究目的でないと借りられないということはないのですが、そもそもAWS 上で使えるリージョンが限られているため、現状では、おそらく絶対数が少ないと思われます。

    また、仮想通貨のマイニング等の不正利用対策で、事前にサービスの上限緩和申請をする必要があります。

    過去のサービス利用状況を踏まえて、段階的に緩和されるため、計画的に実績解除し、上限緩和の必要性を AWS サポートに訴えていく必要があります。

    AWSのGPUインスタンスの利用実績があり、AWSサポートとの上限緩和申請のやり取りしたことがないと、直近で申請を通すことが難しいかもしれません。。

    私の場合は、ローンチ後、2時間以内に上限緩和申請しました。

    オンデマンドインスタンスの上限緩和申請には、現地リージョンの担当者(例:バージニア北部)の承認が必要になりますので、英語での申請の方がいいと思います。

    スポットインスタンスの上限緩和申請には、日本の担当者が一次窓口となり、現地リージョンの担当者にエスカレーションするため、必要性を何度も訴えないと通してくれないと思います。

    A100×1 or 4 のインスタンスが提供されるようになったら、設備増強が完了していると思いますので、また状況が変わると思います。

    https://aws.amazon.com/jp/blogs/news/new-gpu-equipped-ec2-p4-instances-for-machine-learning-hpc/
    P4 インスタンスは 1 つのサイズ (p4d.24xlarge) で利用可能であり、今日では、米国東部 (バージニア北部) および米国西部 (オレゴン) リージョンで起動できます。

  2. DLの将棋エンジンには囲碁エンジンのkatagoの様な
    opcl版の強いエンジンが見当たりません
    以下PC将棋スレからコピペしたものです
    やねさんの見解をお願いします

    CPUモード版でないと市販できないDLエンジンなんて…
    GPUモード版(NvidiaGPU必須)を出して苦情問い合わせが
    殺到して ほとんど売れなかった囲碁ソフトを知っている
    将棋ソフトのpona-xとは苦情問い合わせの中身が違うので
    その囲碁ソフトは回収しなかったが

  3. なんやかんやあってWCSC31ではDeepLearningに転向した深やねうら王が既存のやねチルを蹴散らして優勝するみたいな展開だったら胸熱

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です