AWSのc6aとhpc6aの性能評価

来るゴールデンウィークに開催されるWCSC32(第32回世界コンピュータ将棋選手権)を間近に控え、AWSにすごいインスタンスタイプが登場した。今回はその性能評価を行ったのでレポートしておく。

まず、hpc6a.metalである。96 vCPUという凄いやつである。

オンデマンドなのに1時間 2.88 USDで使える。ZEN3アーキテクチャらしく、シングルコア性能もわりと高い。

やねうら王(V7.10 128-bit Edition)でのベンチマークを掲載しておく。

clang++14 , zen3用 NNUE , bench 262144 96 ← USI_Hash = 256GB , 96スレッド

また比較のため、AMD Ryzen Threadripper 3990X(64C128T)での同ベンチの結果も掲載しておく。

// この計測は、たややんさんに協力していただいた。

全体NPSは同じぐらいなのだが、3990Xのほうは、1スレッド当たりのNPSが低いため、どちらで動かしたほうが強いかと言うと、間違いなくhpc6aのほうである。こんな凄いマシンが1時間たったの2.88 USDで使えるとあっては、もはや将棋AIの大会のために3990Xを購入する時代は終わったのかも知れない。

clang++14 , MSYS2 , ZEN2用 NNUE , 3990X , bench 16384 128 ← USI_Hash = 16GB , 128スレッド

hpc6aは、オハイオリージョンでしか使えないので注意な。

次に、c6a.metalである。こちらはvCPU 192という化け物である。1時間、7.344 USD。hpc6aと比較するとコスパちょっと悪い感じはある。しかしvCPU 192だけあって、NPSは1億3千万ほど出ているのは圧巻である。

clang++14 , zen3用 NNUE , bench 262144 192 ← USI_Hash = 256GB , 96スレッド

ちなみにc6a.metalは、オレゴンリージョンでしか使えないようなので注意な。

ここ近年、やねうら王チルドレンはdlshogiに押され気味であるが、今回はこれで巻き返しなるか…?

AWSのc6aとhpc6aの性能評価」への2件のフィードバック

  1. いつも為になる記事ありがとうございます。「全体NPSは同じぐらいなのだが」の部分なのですが、やねうら王探索部は単純に読んだぶんのNPSが正義だと思っていました。NPS以外で強さに関係するのはどのあたりなのでしょうか?
    以前、少ないThreadで深読みさせるのが良い的なことは聞いたことがあるようなないような。

    • スレッド数が増えた時の実効は、その平方根程度と言われておりまする。つまりは、スレッド数m , 1スレッドのNPSがn だとするとその実効は n√m だす。
      今回のケースでは、合計NPS = nm は同じですが、mの数が96と128 で違います。

      このとき、1スレッドのNPSである n = 合計NPS / m。この実効は 合計NPS / m ×√m = 合計NPS / √m となって、同じ合計NPSならmが大きいほうが実効値が低いので弱いことになるっすな。

コケタニ君 へ返信する コメントをキャンセル

メールアドレスが公開されることはありません。