ponanzaは1兆局面を見てきた?

Engadget日本語版の記事に興味深い記述がありました。

将棋電王戦、今回で終局。佐藤名人×最強Ponanzaの2局で見納め。川上会長「役割は果たした」

山本氏「まず、将棋のプロ棋士の棋譜から勉強します。先生に教わる感じです。その後、いろんな局面で良かったか悪かったかを集めます。Ponanzaの場合は、これまで1兆局面ぐらい集めてきたと思います。なので、これまで地球上でいちばん将棋の局面を見ていたと思います。よかった、悪かったを回収して、調整していっているという感じです」。

学習に使った局面数が1兆局面だということのようです。おそらく、実験のために生成した局面はこの数に含まれていないのでしょう。(実験で生成した局面は、いまのPonanzaが「見てきた」局面には該当しないため)

1回の学習に用いるのが80億局面だとすると、125 epochs(世代)ということになりますが、さすがにそこまで行くまでにサチると思うので、最後のほうは80億より大きな局面数で学習を回しているということなのでしょうか。(よくわかりません)


ponanzaは1兆局面を見てきた?” への10件のコメント

  1. 1兆局面ですか!1秒間に3万局面を学習したとして、
    それを1年間ずーっと続ける。すごい

    • depth6だとして、学習は局面生成の1/100程度の時間で終わります…。(学習時には探索は必要ないので)
      1年だとしたら、362日間局面を生成して、3日間学習を回す感じではないでしょうか。

    • その記事、ちらっとしか見てませんけど、ゲーム木探索で使う場合lookupの速度が支配的でlookup性能はその記事の比較図だと結局hashmap of power of 2が最速で、もちろん、Stockfish系のソフトは当然そうしてまして…つまり何の参考にもならないクソ記事の予感。

  2. PONANZAに勝てば300万円は今日明日ですねやねうらおさんは出場しないんですか?300万円ですよ

  3. そろそろ動かれるということで、今年もやねうら王のご活躍を楽しみに待っております。
    ところでやねうら王2016でAMDの新CPU Ryzen が遅い、または性能を発揮できていないように見えるのはなぜでしょうか?
    Ryzenが不得意とされるAVX2版だけではなくSSE42版でも他のソフトでの結果と比べて芳しくないように見えます。

    • Ryzen、手元にないので何とも…。

      > Ryzenが不得意とされるAVX2版だけではなくSSE42版でも他のソフトでの結果と比べて芳しくないように見えます。

      ソフトが異なるとベンチマークでは、npsに関して公平な比較は難しいのでは…。探索開始局面が同じでもそのあと探索している局面が全く異なりますしね。

      Ryzen、メモリ周りが遅くてprefetchしとかないとスループット出ないとかなのかな?ぐらいの感想。

      • 4月になったら
        う゛ぁーっう゛ぁー
        という状態のものを
        てってれってっててってれってって
        という結果にコミットするということですか?

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です