マシン1000台きぼんぬ

短い持ち時間と長い持ち時間とで、探索パラメーターのチューニングの方針が違うため、長い持ち時間でチューニングしたいパラメーターがいくつかあるのですが、4スレッド1手15秒だと、1局に30分ぐらいかかります。3000対局させるのに107日かかります。

パラメーターを元の値からマイナス方向に動かす/プラス方向に動かす/動かさないの3択だとしたら、この3倍…すなわち1年近くかかることになります。

つまりPC 1台を1年まわせば1パラメーターの1回分の調整が出来るというわけですね。

探索絡みのパラメーターは全部で40個程度。これを10回分ほど調整したいので、すなわち、PC400台×1年分ぐらいの計算資源が必要になります。

まあ、実際には3000回も回さなくてもわかるものもありますし、10回分やらなくても2,3回で済むものもあるでしょう。

それにしても、気の遠くなるような計算資源が必要だということがわかります。

まあ、そうは言っても探索パラメーターを調整してもR50〜100上がるかどうかでしょうから、そんなところに力を入れずに、評価関数の学習のほうを頑張りたいわけですが…。

上記のリンク先の記事には「200を超えるCPUコア」とありますが、VPSだと仮想CPUなので200論理スレッド(100物理コア相当)ではないかと思うのです。

私のほうで試しに棋譜の自動生成の実験をしてみました。

探索深さ3でよければ、やねうら王2016Midで、1コアで1秒間に1000局面ほど生成できるようです。

100物理コアあれば1日86億局面。Ponanzaチームの80億局面に匹敵しますね。たった1日で生成できちゃいます。

Ponanzaチームがいまやっている探索深さ6だと1000局面生成するのが、(やねうら王で計測したところ)その6倍程度。80億局面だと、100コアで1週間あれば終わりそうです。

ちなみにPonanzaチームがいまやろうとしている探索8手での棋譜生成ですが、(やねうら王で計測したところ)深さ3のときの20倍程度。100コアだと20日〜1ヶ月程度でしょうか。

深さ8手も意外と手が届く範囲なんですね。

AWSだと100物理コアを1ヶ月借りるとLinuxのスポットインスタンスで20万円ぐらいのようです。Windowsかつオンデマンドだとその7,8倍ぐらいでしょうか。結構しますね。

そして、それは雑巾を1回絞るのにかかるお値段だということですね。何度も雑巾を絞ることでさらに少しずつ強くしていくことが可能…であるはずです…。

上のツイートで「せいぜい雑巾でも絞ってろ」と捨て台詞を言い放った私ですが、まだ私もたぬきさんのチームも、平岡さんも、雑巾は1回も絞れていません。そろそろ1回ぐらい雑巾を絞らせて欲しいものですね。

そんなわけでして、もう時間もないことですし、Xeon 40コア80HTのPCを何台か買おうかと思っています。


マシン1000台きぼんぬ” への12件のコメント

  1. xeon4WAYの劣化版かつAVX512->インテルPHI!!
    PHIの乗ったPCが60~100万位で変えるのですが、コスパ的にはどう思われますか?
    スレッドモンスターなので将棋との相性はそんなに悪くないと思います。

    • 今回発表(発売は9月)になったXeon Phi(Knights Landing)から、やっと変態仕様のSIMD命令から脱却して、普通の(Intel CPUの)AVX-512を備えるようになりましたし、最下位モデルでも64コア(256スレッド)あるので、それが$2438で買えるなら大変お得であるはずなんですが、前のモデルがAtom相当で、そこからスレッド性能が3倍になったと言われても、Skylakeの1/3ぐらいでしかありませんし、そう考えると64コアあってもXeon20〜30コア程度の計算性能に留まる気はしなくもないです。(だとしたらそんなにお買い得ではなさげです…) いずれは「機械学習ならXeon Phi」の時代が来るのでしょうけども。

      • やねさんの手にかかれば本物のXeonが手に入ってしまうので選択肢にはならないのかな??
        baytrailをメイン機にしてたこともありますけど、OS動かすんだったらそんなに遅くもないですね。PGはすぐ止まるんでバグフィックスしやすかったです。
        でも、まだ早いのかな。うまく大成してほしいものです。
        PHIには期待してます。
        屋根さんにはもっと期待してます。

  2. ここで言う1000局面にかかる時間とは、無作為に抽出した1000局面に対して深さXで全探索するのにかかる時間のことですか?
    またやねさんも平岡さん方式で募集するなら協力させていただきます。

    • > ここで言う1000局面にかかる時間とは、無作為に抽出した1000局面に対して深さXで全探索するのにかかる時間のことですか?

      はい。それで合ってます。実際には、せっかく探索して(深さXでの)最善手が求まっているのでその指し手で1手進めて次の局面を作ったほうが合理的なので、そうしてます。

      > またやねさんも平岡さん方式で募集するなら協力させていただきます。

      ありがとうございます。平岡さん方式、GUI作るのとかデータの受け渡しとか結構たいへんなので、私のほうはとりあえずはXeonマシン数台買って頑張ってみます。CPUが在庫がないとかで、海外からのお取り寄せで納期がすごくかかるようですが。(´;ω;`)

  3. > Xeon 40コア80HTのPCを何台か買おうかと思っています。

    やはり「はぶさん倒すぞ!」ですか。
    消費電力概算を公表して「電力自由化で安いプラン情報求む」みたいな書けば月に1万円くらいは節約できるかも

    • 連続投稿すまぬ

      > Xeon 40コア80HTのPCを何台か買おうかと思っています。

      電力ブレーカーが落ちまくったりせぬか??関西電力に1回確認の電話したほうがいいのかも

      • 私の仕事部屋には電源が6系統来ていて、それぞれが1000Wまでいけるので、Xeon PC、10台ぐらいまで行けるのではないでしょうか。

        • 契約容量のブレーカーの横に回路別のブレーカーが大量に並んでるような家とか羨ますぃw

    • >やはり「はぶさん倒すぞ!」ですか。
      それより「ポナ泣かしちゃる!」の方が近いかと思ってますが、実際どうでしょう?w

  4. ポナに物量で負けていますが別アプローチで何か無いですか

    例えばNDFの「対戦中や探索中に現れた局面を調べ、機械学習結果の欠陥を探して修正しています。」これはさほど効果が無いということですが、注目すべきは「なぜこれでパラメータ調整が可能なのか」みたいな部分だと思います。

    こんな感じの別アプローチとかどうでしょうか?

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です