将棋電王トーナメント3日目、実況スレッド

本日も大会の様子を実況していきます。

道に迷ってた

お陰様で無事会場入りしました。

魔女1.2の件

魔女1.2が強いとか言う噂が流れていますが、Stockfishの最新のコードを取り入れただけなので、やねうら王2016Lateのほうが強いはずです。やねうら王2016Lateは大会終了後、落ち着いたら公開する…かも…。

ponanza vs やねうら王

やねうら王側が先手なのが2対局、後手が1対局の計3局。

なんたる幸運!!ここは、勝率を上げるために、やねうら王側は、当然、あの作戦を選択するです…。[対局開始後に書く]

もちろん、やねうら王側の作戦は、同じ進行にすることです。こうすることで2割の勝率で3台中2台以上が勝つ確率(0.2×0.2×0.8×3 + 0.2×0.2×0.2 = 10.4%)が、正味、2割の確率になるのでこの準決勝で勝ち上がれる確率が2倍ぐらいになるという…。

その期待通り、やねうら王側が先手である2つの対局が同じ進行になりました。これはラッキー!

平岡さん「ponanza、定跡持っているから同じ進行になんてならないのでは?」

やね「初手38銀とかレアな定跡、そんなに分岐つきで掘れないと思いますよ」

平岡さん「あれ?ponanzaは初手から定跡…オフ!?」

そこに様子を見に来る山本くん。

平岡さん「ponanza、定跡、あったんじゃないの?使わないの?」

山本くん「最近は定跡を切るのがトレンドだと聞いて(苦笑)」

平岡さん「それでも定跡のほうがいいんじゃないの?」

山本くん「あの定跡、微妙なのも混じってるし…」

平岡さん「なるほど」

やね「だから、同じ進行に出来るんよ」

平岡さん「そうか…まあ、ボクでも(同じ弱い側を持つなら)そうするか…」

そのあとやねうら王側が変化。

山本くん「そっちが先に変化してるじゃん(笑)」

やね「まあ、これは仕方がないわ(笑)」

山本くん「まあ、そうだね(笑)」

浮かむ瀬 vs 読み太

Windowsの自動スリープの設定がオンのままになっているPCがあったようで読み太のほうがスリープに入ってしまいました。やねうら王も同じ心配がありますが、いま対局中なのでとりあえず定期的にマウスを動かして凌ぐことに。

ponanza vs 真やねうら王 のつづき

[13:53] 3局ある1つが、ponanzaが有利ぐらいから互角へと反省をはじめました。ponanzaがわずかに自分がマイナスだと評価値を出しています。

その後、相入玉でやねうら王が251手目で宣言勝ちをしました!絶対王者ponanzaから価値ある1勝を勝ち取りました。

言うまでもなく残り2戦はやねうら王の負けでしたが…。(´ω`)

浮かむ瀬 vs 読み太

浮かむ瀬 vs 読み太は、浮かむ瀬の3勝で決勝進出。このあと、真やねうら王は読み太と3位決定戦です。

今日はもう時間がなさそうなのでその後の結論だけ。

読み太 vs 真やねうら王は、真やねうら王の3勝。
ponanza vs 浮かむ瀬は、ponanzaの3勝。

ponanzaは昨年のバージョンに9割勝つらしいです。(よく真やねうら王、1発入ったな…。)

他の開発者とのディスカッションに忙しくてブログ更新があまり出来なくてスミマセンでした。応援してくださった皆様、本当にありがとうございました!

 

将棋電王トーナメント3日目、実況スレッド」への75件のフィードバック

  1. 最終日がんばってください(ソフトもやねさんも)。
    対ponanza、なにか策はありますか?

  2. グッスリ眠れましたか。いよいよ最終日ですね。辿り着けて良かったです。東京は方位磁石が必須です。

  3. 間に合って良かったです。
    応援しときます。

    魔女最新について、
    旧verに比べ多少指し手が変わるときがある。
    大駒の使い方がちょびっと上手くなっている気がする。

    新旧対決のように完全同型だと過剰にR差が出るので、強くはなっているがちょっとだけかな。

      • なるほど。
        やねうら王3.57と魔女1.102が同じ強さでしたから、確実に超えていそうですね。
        魔女は頓死問題もありますし、今後の伸び代を考えても大丈夫ですね。

  4. 今日のポナ戦、楽しみにしています(せめて1勝してほしい)

    あと、昨日行われたというプログラマー同士による将棋大会についてできれば教えてくださいw

  5. アイドル状態で浮かむ瀬の消費電力が他より10Wくらい多めなんですが、Linux入れた影響でしょうか?
    平岡さんにお伺いしていただければ。

    もし魔女1.2でもっとレート上がってるようだったら本当に謎ですな。この辺は検証結果待ち。

  6. やねうら王、突っ込み過ぎな気がします。
    やねうら王3.57は読み太のようなバランス型力戦で、他のソフトに無い良さがあったんですが「大会前日ですが、やねうら王大改造の件」の影響?
    Ponanzaに駒を釣り上げられて空間がスカスカの危ない陣形になってます。

  7. 読み太さんと話ししたら、ツイッターとかやるように言ってください!!
    ぜひ情報発信すべきです

  8. 読み太の途中アイドルは指し直しを要求していいレベルの話だと思うのですが、もしやねさんがこれに当たってたら指し直し要求しましたか?

      • まずは、ponanzaへの一発、見ていてスカッとしました。
        読み太との3位決定戦楽しみです、頑張ってください。

        スリープの件ですが、ニコ生で昼休みのときたまたま消費電力表示画面が出て、読み太1番がアイドル状態になってて、あれって思ったんですよ。
        だから頻発してるんじゃないかと思いまして、トータルで1分未満だったなら心配も不要でしたか。

        最終的には他の2つも浮かむ瀬勝利でしたから影響はなかったとはいえ、1番は両者に切れ負けの可能性もある勝負になってましたから、もし1−1で終わって最後が切れ負けだったりしたら、そこはプロテストを当然要求しなきゃいけないところだったかなあとは。

  9. 対ポナンザ戦、手に汗握る展開ですね。何とか引き分けにまで持ち込んで欲しいです

  10. 戦法といい、ギリギリの入玉勝ちといい、魅せますね!

    少なくとも今回でPonanzaが絶対王者ではなく、手の届く範囲だと証明出来ましたね。

    読み太とは新旧対決みたいな感じになりそうですね。
    がんばってください。

  11. おめでとうございます!!まさか、こういう形でワンパン入れるとは!!稀代のトリックスター!!!

  12. ポナンザ相手に一勝入れられるとは素晴らしいの一言に尽きます。作戦通りの面もありましたね。

    二勝一敗で敗れたのは残念ですが。三位決定戦がんばって下さい。応援しています

  13. ポナンザに勝利おめでとうございます。

    引き分けになるかと冷や冷やしました。
    ぎりぎりで宣言勝ちを目指し始めたのは引き分けになる256手目以降は読まない設定で、浅い部分の読みが広がり宣言勝ちの局面を見つけたからなのでしょうか。

  14. どのタイミングで宣言勝ちに向かうとか決まってないんでしょうか
    やるかやらないかでやきもきしてました

    • 探索のleaf node(末端の局面)で宣言勝ちが出来るならそちらを選びます…が、今回はponanzaの玉が中段にうろうろしていて、それを追いかける変化を色々読んでいたため、なかなか宣言勝ちの局面がleaf nodeに現れなかったようですね。

  15. ponanzaへの1勝おめでとうございます

    結果から見ると、真やねうら王は去年のponanzaと同レベルの強さということなのでしょうか?(決勝時点で:3戦のみの結果からそう見るのは問題あるでしょうが)

  16. ponanza 戦での1勝おめでとうございます。
    結果は1-2でしたが、0-3とは大違いですね。
    すくなくても、頑張れば手の届くところにいると考えられます。
    李世乭とAlphaGoでの 李の1勝と同じ価値を感じました。

    願わくば来年は早目に着手され、1週間前には左団扇で臨まれる事を期待したいです。

      • 試合条件はおおよそ変わらないと思われるので、まず真やねうら王にR150くらいつけるソフトを作って放流する
        次にその後皆さんの結果を見て前述の改良ソフトにR150くらいつくソフトを作る
        これを3ヶ月くらいの間隔で繰り返せば!

        ってそんな簡単に行きませんよねw
        最大の問題は、平岡さんと磯崎さんが開発を続けてくれるかどうかですね(良いライバルのいない世界はすぐ悪くなる)

        • floodgateに何か目標となるソフトがあるといいかも知れませんね。まあ、上位の開発者は基準ソフトを複数用意して、それと自己対戦させているので(1万対局ぐらい回さないといけないためfloodgateでは試合数が足りない)、floodgateにはなかなか流さないのかも知れませんけども。

  17. 3位おめでとうございます。
    なんだかんだで安定力(残留力)抜群ですね。

    予選5位から決勝Tで予選4位、予選3位に勝って、1位に一発。
    後はApery(浮かむ瀬)にリベンジするだけですね。

    お互いフリー公開でユーザー間で白黒つけてもらいましょう。

  18. 3位おめでとうございます。
    ポナンザにも勝てるポテンシャル!
    そこに痺れるあこがれる!!

    お疲れ様でした。
    おめでとうございます。

  19. 入玉宣言勝ち!すばらしい。
    今の最強クラスのプログラムは、入玉形でも強く、たとえばトップアマが互角の入玉形から指し継いで番勝負しても勝ち越すんじゃないかと感じます。

    中盤で形勢に差がついた局面の研究に用いる棋士が多い中、千田五段が終盤の「玉の安全度の見切り」の訓練に活用しているのが印象的で、どんな使い方がハマるのかが楽しみです。

    • いやー、今回のやねうら王の入玉宣言勝ちも早くに23銀打てば決まっていたので、ソフトの入玉は(宣言勝ちが絡むのは)まだまだなんだなという感じです。

  20. プログラム完全素人です。いくつかアイデアがあるのでただのディープラーニングとソフトのマニアの素人の戯言として見てもらえればと。

    まず一つ目
    ponder時のみマルチPVと詰将棋ルーチンを採用する。
    手の合わないソフト(より強いソフト)に対し有効。おそらく自己対戦では勝率を下げる要因なのでこの手法は発見しずらいかなと。

    二つ目
    進行度をつけ、それぞれの評価関数を自動で調整。
    (説明を簡単にするため、将棋はすべて100手で終わり進行度は手数で線形に進行すると仮定する)

    1個の評価関数を2個に分ける

    50手未満の手のみで雑巾絞り(この評価関数をaとする)、50手以降の手のみで雑巾絞り(この評価関数をbとする)

    a、bをまたそれぞれまた2個に分ける

    ~25手、25~50手、50~75手、75~100手の手のみから雑巾絞り

    以下略

    KKPであれば読み込みに時間がかかりできないとかであればKPのみこれを行うとか。
    もちろん、手数で進行度を図るんではなく、機械学習やDLで線形に近似するプログラム上簡単な関数を用いるとして、
    毎回間に進行度を機械学習する必要性などもありそうですが。

    三つ目
    評価値-3000(水平線効果が出やすくなる評価値)から読んでいる最終手-1手をパスするように探索する。
    31手読んでいるとすれば、30手目に相手は相手は一手パスを指してくると仮定して探索。
    おそらく下位のソフトや人間への取りこぼしが減る。

    以上です。

    ponanza以外で計算資源を大量に持っているやねさんであれば特に2つ目は有効だろうと思いここに書かせていただきました。
    ぜひ来年出るのであれば優勝してください。
    プログラムの素人なのでむちゃくちゃなことを言っていたのであればすいません。

    • > ponder時のみマルチPVと詰将棋ルーチンを採用する。

      USIプロトコルのponderを無視して普通に2手前の局面で探索すれば実現は可能です。やねうら王も5年ぐらい前にはそうしていた覚えが…。(MultiPVではないですが、MultiPVである必要はないと思います。) ただ効果に乏しいので習甦以外のソフトでやっているのを見たことがないですね。やねうら王もいまはやっていません。

      > 50手未満の手のみで雑巾絞り(この評価関数をaとする)、50手以降の手のみで雑巾絞り(この評価関数をbとする)

      三駒関係ってどうせ終盤のほうでしか出現しない位置関係とかがあるので、三駒関係で序盤と終盤とで分けても仕方がないようです。(いまのところ)

      > 評価値-3000(水平線効果が出やすくなる評価値)から読んでいる最終手-1手をパスするように探索する。

      そのへんは各種枝刈り等でうまくカバーされているので、いまどきのソフト、水平線効果自体はほとんど見られないと思います。

  21. 絶対王者のponanzaに一発入れられて良かったです。タイムシフト見ましたが山本さん勝負には勝ってるのに負けたみたいな顔していましたもの。それだけVS 羽生への思い入れが強いのが見て取れました。
    また、既に決勝トナメでponaは優勝するのか?ではなくponaは一回も負けないのか?に焦点が当たっていたことも、またponaの圧倒的強さを物語っていると言えるでしょう。そこに一発入れたことは、やねうら王の強さを間接的に証明している思います。
    とにかく三日目は全ての戦いが異次元の戦いで面白かったです。お疲れ様した!
    これは個人的な考えですが
    やねうら王やaperyのオープンソース化は、(オープンソース化しない)ponanzaという強者をチルドレンがトーナメントで削り取るといっては語弊がありますが、pona VS 「それ以外」の「それ以外」を増やすという意味でponaが優勝する確率を下げる戦略になっていますね。今回の電王トーナメントでの出場ソフトは過去最多といいますし。それでも屈しなかった(?)ponanzaには敬意を表する以外ありえないwww。

  22. 電王トーナメント3位おめでとうございました!
    PC・電気代の費用回収には程遠いでしょうけれど…

    それにしても、去年の電王トーナメント版+380とは・・
    追いつくどころか、離されていたんですね。

    浮かむ瀬、真やねうら王その他のオープンソーストップ勢が
    R3700とすれば、ポナンザはR4100あたりでしょうか。

    少なくともR4000を超えているとすれば、プロRで2600以上でしょうから、スマホでも十分名人を倒せる計算になってしまいますね・・

  23. 3位おめでとうございます。
    ハイレベルな争いで見ごたえありました。

    PONANZA との差は探索の細かい工夫の積み重ね?
    それとも微妙な中盤以降の評価関数の差でしょうか?
    別記事で分析期待してます!

  24. 決勝は用事で見てなかったんですが、
    ponanza vs 浮かむ瀬 戦で下記のような局面での評価値がおかしいと見ました。

    後手の持駒:銀 歩二
    9 8 7 6 5 4 3 2 1
    +—————————+
    |v香v桂 ・v金 ・v金 ・v桂v香|一
    | ・v玉v銀 ・ ・ ・ ・v銀 ・|二
    |v歩v歩v歩v歩v歩v歩 ・v歩v歩|三
    | ・ ・ ・ ・ ・ ・ ・ ・ ・|四
    | 歩 ・ ・ ・ ・ ・ ・ ・ ・|五
    | ・ ・ ・ ・ ・v角v歩 歩 ・|六
    | ・ 歩 銀 歩 歩 ・ ・ ・ 歩|七
    | ・ ・ 金 ・ ・ ・ 金 ・ 飛|八
    | 香 桂 玉 ・ ・ ・ ・ 桂 香|九
    +—————————+
    先手の持駒:飛 角 歩
    後手番

    これはたまに見るアマチュア戦法の即死ルートを踏んだ局面ですね。
    Ponanzaは将棋ウォーズのフィードバックがあるので普通に学習済み局面だっただけではないでしょうか。
    評価値については私が「ゲーム木探索で「延長」の対義語は?」で書いた状態ですね。こんなマレ局面が電王戦の決勝で出るとは予想外でしたね。
    この戦法の定跡は下記のような変化だったと思います。

    ▲7八金 △3四歩 ▲7六歩 △4二飛 ▲9六歩 △6二玉
    ▲9五歩 △7二玉 ▲4八銀 △8二玉 ▲6九玉 △3五歩
    ▲2六歩 △3二飛 ▲2二角成 △同 銀 ▲8八銀 △7二銀
    ▲7九玉 △3六歩 ▲同 歩 △同 飛 ▲3七銀 △同飛成
    ▲同 桂 △3六歩 ▲4五桂 △3七歩成 ▲2九飛 △4四銀
    ▲6六角 △4二金

    後手の持駒:角
    9 8 7 6 5 4 3 2 1
    +—————————+
    |v香v桂 ・v金 ・ ・ ・v桂v香|一
    | ・v玉v銀 ・ ・v金 ・v銀 ・|二
    |v歩v歩v歩v歩v歩v歩 ・v歩v歩|三
    | ・ ・ ・ ・ ・v銀 ・ ・ ・|四
    | 歩 ・ ・ ・ ・ 桂 ・ ・ ・|五
    | ・ ・ 歩 角 ・ ・ ・ 歩 ・|六
    | ・ 歩 ・ 歩 歩 歩vと ・ 歩|七
    | ・ 銀 金 ・ ・ ・ ・ ・ ・|八
    | 香 桂 玉 ・ ・ 金 ・ 飛 香|九
    +—————————+
    先手の持駒:飛 歩

    ここから68手目くらいまで一直線の変化で、先手が互角ルートを3つ選べる感じだったと思います。

    Apery(浮かむ瀬)がこんなマニアックな戦法を作り出したことに驚きました。
    Apery(浮かむ瀬)が弱いわけではなく、電王戦があんな微妙なPCスペック+設定じゃなければ正解ルートを選択していたと思います。
    そしてPonanzaがどのルート選択するのか見たかったですね。

    • > Ponanzaは将棋ウォーズのフィードバックがあるので普通に学習済み局面だっただけではないでしょうか。

      上位のいずれのソフトも既存の棋譜の局面や特定の局面を学習させているわけではないので、そういうことではないですね…。単にponanzaの読みと大局観(評価関数)が優れていたということなのでしょう。

  25. 今回は新たに特別賞が制定されましたが
    これは受賞すると何か貰えるんですか?
    高級ピストンマシーンとかですか?

  26. 電王トーナメント3位おめでとうございます。

    PR文書を拝見する限り、真やねうら王は直接・間接いずれにも人間の棋譜を参考にしていないように読めますが(駒の評価は別として)、その理解で合ってますでしょうか?

    ひようら王も相当に強かったですが、プロを上回る棋力のソフトでそういったものは、まだ他になかったように思います。もしかしたら開発者の方々からしたらまた見方が違うのかもしれませんが、素人目にはかなり画期的なことのように思えまして…。

    • 昨年のやねうら王より少し弱いぐらいのところまでは出来たようだったのですが、その後の学習に時間がかかりすぎるため(学習部の調整の手間暇もありますし)、一旦そちらは途中で諦めました。

      • ご返信ありがとうございました。
        しかし、昨年のやねうら王より少し弱いくらいでしたら、対人間、対プロという観点では既にして相当の強さですよね。それはそれで十分な到達点に思えますので、大変興味深いです。

        • はい、これはこれできちんと追試できる形で記録やら何やらを残しておきたいのですが、いかんせん、そこまで手がまわっていません。(´ω`)

          • 人間の棋譜を参考にせずに人間を超えたソフトがどのような指し回しなのか、是非見てみたいです。
            絶対王者Ponanzaに一発入った真やねうら王の公開も楽しみですが、可能であれば、真ひようら王?に関する記録(や実行ファイル?)の公開も期待して待っております。

          • > 人間の棋譜を参考にせずに人間を超えたソフトがどのような指し回しなのか、是非見てみたいです。

            どうせ評価関数の表現の限界がありますから、勝率が上がるようにひたすら学習させていくと同じようなところ(同じような指し回し)に行き着くと思いますよ。今回の上位のソフトは全部、昨年のponanza風になってますし…。

    • wcsc26の激指も人間の棋譜をまったく使わず学習したと書いてました。

      80億局面で学習始めたponanzaも人間の棋譜を見なくなったと2年くらい前に書いてましたが、
      人間の棋譜をもとにした評価関数と生成局面の組み合わせでスタートは人間の棋譜ですかね。今のバージョンはどうか分かりませんが。

  27. 一部の対局でAperyが特定の手を見落としたような放送がされていましたが、こういう事態はどうして起きるのですか?

    評価局面数はPonanzaと大きく変わらないように見え、評価値もグラフの特徴が似る程度にまでは近づいているように見えます。それなのになぜAperyでは特定の手が無視され、Ponanzaではしっかり評価されるのか不思議でたまりません。
    手の生成時点で生成していない手が多いのか、枝切りの手法が根本的に違うのか、それとも評価関数の少しの狂いから切ってはいけない枝が切られやすくなっているのか・・・・原因はどこにあるんでしょう?

    • > 手の生成時点で生成していない手が多いのか、枝切りの手法が根本的に違うのか、それとも評価関数の少しの狂いから切ってはいけない枝が切られやすくなっているのか・・・・原因はどこにあるんでしょう?

      どのソフトも指し手生成自体はすべての合法手(ただし歩の不成などは除く)を生成しています。枝刈りと評価関数の正確性はponanzaのほうが断然良いと言うことでしょうね。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です