ponanzaは1兆局面を見てきた?

Engadget日本語版の記事に興味深い記述がありました。

将棋電王戦、今回で終局。佐藤名人×最強Ponanzaの2局で見納め。川上会長「役割は果たした」

山本氏「まず、将棋のプロ棋士の棋譜から勉強します。先生に教わる感じです。その後、いろんな局面で良かったか悪かったかを集めます。Ponanzaの場合は、これまで1兆局面ぐらい集めてきたと思います。なので、これまで地球上でいちばん将棋の局面を見ていたと思います。よかった、悪かったを回収して、調整していっているという感じです」。

学習に使った局面数が1兆局面だということのようです。おそらく、実験のために生成した局面はこの数に含まれていないのでしょう。(実験で生成した局面は、いまのPonanzaが「見てきた」局面には該当しないため)

1回の学習に用いるのが80億局面だとすると、125 epochs(世代)ということになりますが、さすがにそこまで行くまでにサチると思うので、最後のほうは80億より大きな局面数で学習を回しているということなのでしょうか。(よくわかりません)

ponanzaは1兆局面を見てきた?” への26件のコメント

  1. 1兆局面ですか!1秒間に3万局面を学習したとして、
    それを1年間ずーっと続ける。すごい

    • depth6だとして、学習は局面生成の1/100程度の時間で終わります…。(学習時には探索は必要ないので)
      1年だとしたら、362日間局面を生成して、3日間学習を回す感じではないでしょうか。

    • その記事、ちらっとしか見てませんけど、ゲーム木探索で使う場合lookupの速度が支配的でlookup性能はその記事の比較図だと結局hashmap of power of 2が最速で、もちろん、Stockfish系のソフトは当然そうしてまして…つまり何の参考にもならないクソ記事の予感。

  2. PONANZAに勝てば300万円は今日明日ですねやねうらおさんは出場しないんですか?300万円ですよ

  3. そろそろ動かれるということで、今年もやねうら王のご活躍を楽しみに待っております。
    ところでやねうら王2016でAMDの新CPU Ryzen が遅い、または性能を発揮できていないように見えるのはなぜでしょうか?
    Ryzenが不得意とされるAVX2版だけではなくSSE42版でも他のソフトでの結果と比べて芳しくないように見えます。

    • Ryzen、手元にないので何とも…。

      > Ryzenが不得意とされるAVX2版だけではなくSSE42版でも他のソフトでの結果と比べて芳しくないように見えます。

      ソフトが異なるとベンチマークでは、npsに関して公平な比較は難しいのでは…。探索開始局面が同じでもそのあと探索している局面が全く異なりますしね。

      Ryzen、メモリ周りが遅くてprefetchしとかないとスループット出ないとかなのかな?ぐらいの感想。

      • 4月になったら
        う゛ぁーっう゛ぁー
        という状態のものを
        てってれってっててってれってって
        という結果にコミットするということですか?

          • RIZAPという単語を改めて見てみると、Ryzenとそんなに似てるわけでもなかったかw

            回っているどら(←なぜか変換できない)が倒れない理由って、慣性は等速直線運動で、回転運動にはその慣性を遠心力という名前に変換するような向心力が必要でとか、それらが釣り合った状態でどら(←なぜか変換できない)は等角速度運動をしているとして、傾こうとするとどら(←なぜか(ry)のある1点が回転中にたどるコースが長くなって、それの帳尻を合わせるためにコースが短くなる点が生じて、その点とのモーメントの合計がウンタラカンタラとか、そのあたりから攻めるんじゃね?知らんけどw とか考えた。

  4. 後5日で「佐藤天彦叡王 vs PONANZA」が始まりますが、どっちが勝つと思いますか?それからfloodgateでsmがrate3800越えてるんですが、smの強さの秘密は何だと思いますか?

    • > どっちが勝つと思いますか?

      1局だけの勝負だとしてもponanzaの勝率、98%ぐらいありますよね…。

      > smの強さの秘密

      同じぐらいの棋力のソフトしか並んでいない状況なので、マシンスペックと定跡で上方修正されているだけなのでは…。

  5. ポナンザと互角に戦えるのポナンザだけなんじゃね?
    ポナンザ対ポナンザの棋譜を数万局暗記すればかてるんじゃね?

    • 終局までだと数万局で済むかどうかはわかりませんけども、優勢になるところまでだけで良ければ数千局ぐらいかも知れませんね。
      PC、数十台あれば3ヶ月ぐらいで生成できそうではあります。

      • 返信ありがとうございます。

        佐藤名人はどうやって研究しているかわかりませんがポナンザと戦いながら研究というのは素人目には難しい気がします。

        • もう事前研究なんてしなくていいのではないかと思いますけどね…。研究しても本番で研究局面になるわけでもないですし、穴が見つかるわけでもないですし…。

  6. Ponanzaがディープラーニングに成功したようですが、今後は将棋ソフトにもディープラーニング旋風が吹き荒れるのでしょうか

  7. 第27回世界コンピュータ将棋選手権のアピール文書、全チーム出そろいましたね。やねうらおさんは、どれか気になったアピール文書ありましたか?

  8. ディープラーニング将棋が出てきますね。

    やねうらお氏は人間の知性を追い求めていましたが
    ディープラーニングは、やねうらお氏にとっての答えなのでしょうか?

    PS
    コマですが「遊ぼう!米ちゃんとわんぱく実験 まわしてナットク!コマの秘密」あたりがお勧めです。ビシっとした答えが出てくるわけではないですが。

    • > ディープラーニングは、やねうらお氏にとっての答えなのでしょうか?

      いまのところ、人間が知性と呼んでいるもののほんの一部がdeep learningで実現できるという程度ですね…。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です