電王トーナメントを終えてその1

終えたのは終えたが、私のなかではまだ終わっていないのだ。

体力が回復したら、他のソフトについて詳しいことを書きます。
何か書いて欲しい話題があればコメント欄でコメントください。

来年のやねうら王は、tanuki-の野田さんと手を組む予定。

ツール類だけ共同で開発して思考エンジン本体は個別に開発し、別個のソフトとしてそれぞれが電王トーナメントに出場する可能性もあります。(まだ詳しくは決めてないです。)

つづく

電王トーナメントを終えてその1” への25件のコメント

  1. tanuki-さん、Ponanzaをぶっ倒すまではやねうら組所属、組長やねさんとし、それまでは宿敵Ponanzaをぶっ倒す事を第一目標とする。

    Ponanzaをぶっ倒たおした後は、めでたく「のれん分け」をして、tanuki-組の成立を許す、、、
    というのはいかがでしょうか?

    ちなみに、Ponanzaに土をつけたnozomiちゃんの強さの秘密は何でしょう?

    • > ちなみに、Ponanzaに土をつけたnozomiちゃんの強さの秘密は何でしょう?

      強さ的には今回のApery(大樹の枝?)のほうが強いと思いますよ。nozomi ≒ Apery(WCSC25)だと思います。KPE次元下げはせず、探索パラメーターの調整で頑張った感じですね。

      • それではこんな感じですか?
        Ponanza>大樹の枝>nozomi ≒ Apery(WCSC25)> ≒やねうら王

        PonanzaはApery(WCSC25)基準で+300ぐらいと思っていればいいでしょうか?

        • 大樹の枝とApery(WCSC25)の差はR100程度のようです。
          大樹の枝とPonanzaとの差はデータが少なくてちょっとよくわかりません。R200は離れている気がしますが…。

          Apery(WCSC25)からだとR350〜R450ぐらいですかねぇ…。

  2. 最近は共同開発のソフトが多くなりましたが、どのように役割分担をしているのでしょうか?
    タヌキさんをこき使って、おいしい所だけ持ってくんですか?

    • たぬきさんには、「私からは何ひとつとして、これをしなさい/してくださいというような指図はしませんので、自分のやりたいことだけをやりたいようにやってください。」と言ってあります。

  3. お疲れ様です。やねうら王mini楽しみです!

    ちなみにノーマルやねうら王のどのルーチンの行数が一番へらせそうなのでしょうか?

    • floodgate、上位ソフトの参加者少なくて、マッチングもあまりよろしくなくて、参加するのにPCが自前で必要ですし、他の参加者のPCスペックがわからない&不揃いなので公平な比較が出来ませんし、開発上はあまり役に立たない(完成後のランニングぐらいには役に立ちますが)と思っているので、あんまり興味がないです。実行ファイルをcommitすればあとは勝手にサーバー内で対戦してくれるといいのですが…。

  4. なんかハッカソンできそうな縛りですね。
    大体1000行で将棋所で動く最強の将棋ソフトを作れ。
    4位の賞金そっちに回しません?(邪笑)
    まぁ、半分冗談です。

  5. > 何か書いて欲しい話題があればコメント欄でコメントください。

    千田5段が言っていた、トップの将棋ソフトとレーティングにして800の差があるという発言について考察をお願いします。

    ・千田5段の言うレーティング800差はfloodgateの可能性が高い(最新のPonanzaがレート付で現れるのはfloodgateぐらい?)
    ・6h_human(最新レート2713)が千田5段?それならば、Ponanzaと800近い差になる。
    ・比較のために一般的なEloレーティング(例えば、http://kishi.a.la9.jp/ranking2.html)とfloodgateのそれが同一か確認。
    (一般的なEloレーティング)
    「https://ja.wikipedia.org/wiki/%E3%82%A4%E3%83%AD%E3%83%AC%E3%83%BC%E3%83%86%E3%82%A3%E3%83%B3%E3%82%B0」に従っている。

    すると、期待勝率E'(⊿R) = 1/{1 + 10^(-⊿R/400)}

    一方、floodgateのratingは「http://shogi-server.osdn.jp/rating.html」により、
    「http://hosi.org/a/Rating.html」を参考にしたとある。
    (「http://shogi-server.osdn.jp/rating.pdf」はpdfが壊れてる)

    従って、期待勝率E'(⊿R’) = 1/{1 + 3^(-⊿R’/200)}

    以上より、E(⊿R) = E'(⊿’R)を解くと、⊿R’/⊿R ≒ 1.05。
    つまり、>>1のレート差もfloodgateのそれも大差ない。

    ・しかし、色々なデータから予想する最強将棋ソフト(現在はPonanza)のレーティングは電王トーナメントのハードウエアで2100程度。千田5段とは400程度の差。

    ・なぜ、倍近くも離れているか?
     ・対局数が少なくてレーティングがそもそも収束していない?(投稿時点で51局)
     ・ floodgateの持ち時間10分, 秒読み10秒は人間に不利。
      (持ち時間が長ければ人間側は+200~300ぐらいになる。YSSの解説
      「http://www.yss-aya.com/20141107gpw_meijin.pdf」p54)

    ・さらに、実際には研究という名の序盤攻略ゲームが入るから、差はさらに
    -100~200ぐらい減る。

    つまり、仮に、叡王として千田5段がPonanzaと闘うなら、「当日の」レート差は
    -300~-200で、勝率は15%~24%ほど。叡王はもうちょっと強くなるから、
    何だかんだで第一期電王戦はいい勝負になる?

    ・ドワンゴは計算してか否か興行になるスペック・ハンデ・時間を選んできてる。これはすごいことだと思う。

    • Ponanzaは自動生成したゴミクズ定跡を搭載しているので序盤は確実にバラけて、研究にはハマらないと思いますよ。ゴミクズ定跡、対人×貸出では威力を発揮しますね。千田五段のR800はfloodgateのレーティングが収束していないソフトに対する差であって、収束したらもう少し縮むとは思います。また、仮にR800離れていたとしても、将棋では期待勝率、5〜10%ぐらいはあると思いますよ。

      • >Ponanzaは自動生成したゴミクズ定跡を搭載しているので・・・・

        ビッグマウスはPonanzaをぶっ倒してからでないと迫力がいまいちかな、、、と。

        • えー。誰がどう見てもゴミクズでしょう。あの定跡の局面から対局したい有段者はほとんど居ないと思いますよ。

          そして、そんなゴミクズ定跡を上回る超ゴミクズ定跡をやねうら王は来年、搭載するかも…。

          • 有段者が見ると「ゴミ屑に見える」訳ですか。 

            プロ棋士の文化圏にない定跡を搭載する戦略というのは、対人、そして現状の対COM戦の両方に有効である、よいねらい目になるのですね。

            そして、それもPonanzaの強さの秘密の一つでしょうか。

      • なるほど、定跡の数自体を増やしてしまうというのは有効な対応ですね。2日制になればなおさら対局数が稼げなくなるわけだし。

        800差は単純に計算すると1%も勝てませんが、レート差の期待確率が妥当なのが±400以内程度ということですね。

  6. お疲れ様でした。

    前回と今回のPCのスペック差は、どのくらいでしょうか。
    ざっくり Elo でどのくらい下がっていると推察されていますか?

    では、では。

    • 6コア(前回)と4コア(今回)の差ですし、前回よりCPUの世代が新しいので、R30程度の差しかないのでは。棋譜を見て体感できるレベルではないですね。上位のソフトはどのソフトもソフトの改良で昨年からR100以上上がっているでしょうし。棋譜の質は昨年より上がっていると間違いなく言えるので、PCスペックのダウン(?)は問題とならないのではないでしょうか。

      • 電王戦の持ち時間がチェスクロック5時間から8時間になることで、1局で見たトータルの計算量はどの程度変化するものと推定されるでしょうか。

        ソフト側の時間消費に革命的な展開がない限りは、盤面この一手しかないというところでも無駄に時間を使うのでしょうが、反面相手方棋士の思考時間も増えてponderに使える時間が伸びるとすれば(ハメ手順を発見されてノータイム指しを連発されないかぎり)、コア数の減少を補える程度の計算量は担保されていると推定できるでしょうか。

        また、仮に電王戦に出場されていた場合、やねさん的に時間消費について考えられていたことはあるでしょうか。これはオープンにしても、チェスクロック8時間のソフト戦なんてないですから将棋ソフト内のやねうら王の相対的な位置に影響するとも思えないので、お伺いできればと。

        • > 電王戦の持ち時間がチェスクロック5時間から8時間になることで、1局で見たトータルの計算量はどの程度変化する

          ここで言う「計算量」とは何のことでしょうか。探索ノード数ならおおよそ8/5倍になるのでは…。

          > ソフト側の時間消費に革命的な展開がない限りは、盤面この一手しかないというところでも無駄に時間を使うのでしょうが

          Aperyでも盤上この一手のところは、思考時間結構短いですよ。

          • Apery、そうなんですか。
            前回の電王戦の王手ラッシュのときはきっちり60秒使っていたんで。

            > ここで言う「計算量」とは何のことでしょうか。探索ノード数ならおおよそ8/5倍になるのでは…。

            コア数が減ることによって、探索数は単純に1.6倍にはならないと思っていたものですから。

          • 前回の電王戦の王手ラッシュで60秒使ってたのはあのあと修正されてますね。いまのApery(や上位のソフトはどれも)時間の振り分け方とかうまいもんですよ。

            > コア数が減ることによって、探索数は単純に1.6倍にはならないと思っていたものですから。

            コア数が減ることも込みですか。ええとそれなら、コア数が2/3になって、20%程度の実効のダウン。時間が8/5になって、1.6倍。0.8×1.6 = 1.28倍の実効。ソフト自体が前回よりR150ぐらい上がっていて、1.28倍なのでR50ぐらい寄与して、トータルではR200up。前回から棋譜の質としてはR200ぐらい上がったプレイヤーが対局している(ように見える)棋譜が出来上がると予想されます。

  7. Ponanza対nozomiの評価値の逆転現象についての見解を教えてください。

    大樹の枝も同様に-1500程度の数値から負けになります。
    何度も待ったして何とか逆転されない筋を探してみましたが全部ダメで諦めました。

    あの局面で評価値互角をつけられるソフトというのはあのソフトだけだと思います。
    今までにない改良が加えられたと推測しますが
    やねさんも対抗できる秘策はありますか?

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です