プロ棋士と最新のソフトとの適切な手合は?

以前、羽生さんが「将棋の神様との手合(ハンデ)は?」と尋ねられて「角落ちならなんとか。香落ちではだめですね」のように答えた。(この質問には、何度も色んなメディアに対して答えている。)

羽生さんのようなトップ棋士はともかく、平均的なプロ棋士の場合の適切な手合はどれくらいなのだろうか。

ここに将棋の神様を連れてくるわけにはいかないので最新の将棋ソフトとの比較で考えてみる。

uuunuuunさんのサイトの記事によるとelmo(角落ち)と大樹の枝がほぼ互角のようだ。

elmo (YaneuraOu 4.61 tournament) R3979
elmo (角落ち) vs 大樹の枝 (R3250) 46-2-52 R差20 R3270

この計測されたときにやねうら王のほうは駒落ちの評価値がおかしいバグがあった気がする。それが修正されたのはV4.68だ。まあ、話がややこしくなるので、このバグのことはいま考えないことにする。

あと、relmo8だとelmoから+R100程度向上している。(駒落ちでどれくらい有効かはわからないが…)

また、電王戦FINALのときにApery(2014年版)を貸し出され、事前研究した斎藤慎太郎七段(当時は六段)が、Aperyに勝率2,3割(うろ覚え)だとか局後インタビューで答えていた気がする。

また斎藤慎太郎七段は、プロ棋士レーティング(R1500を平均とする)で現在R1769のようで、平均を大きく上回る。(Aperyの貸出当時2015年1月としてそのときはR1638らしい。ここでは、こちらのデータを採用する)

あと、uuunuuunさんのサイトによると、Apery(2014)は、大樹の枝(Apery2015)と比べるとR200ぐらい弱い。

以上をまとめると次のようになる。

平均的なプロ棋士 << (R138差) << 斎藤慎太郎六段(2015年当時) << 家庭用PC(4コア)Apery(2014) << (R200差) << 家庭用PC(4コア)大樹の枝 ← 角落ち → 家庭用PC(4コア) elmo << (R100差) << 家庭用PC(4コア)relmo8 << (R200〜400ぐらいの差) << 最新のPC(48コア) relmo8

これからすると、平均的なプロ棋士だと角落ちでは最新のPC+最新のソフトに勝ち越すのは(対策なしなら)非常に厳しいという結論になりそうだ。飛車落ちの手合が妥当なのかどうかはこの後の検証が待たれる。


プロ棋士と最新のソフトとの適切な手合は?” への19件のコメント

  1. ソフトとプロの差は
    2枚落ちは、いくらなんでも
    角香車落ちくらいかと
    飛車でいい勝負なのかな

    電王戦は駒落ちで継続すべきでしたね

      • 日本の将棋プロは謙虚さがないので駒落ち(ソフトに飛車落として対局)しないでしょうね囲碁界の謙虚さ潔し

        • 戦前はプロの対局でも駒落ちは普通にあったので、「プロは平手で対局するのが当たり前」という考えは若手プロが勝手にそう思っているだけのような気もするんですけども。

          まあいずれにせよ、当面、実現しそうにないのは残念ですね。

  2. 斎藤さんが貸し出されたのは大樹の枝ではなく「電王戦ファイナルバージョン」、私のレート表では単にAperyと書かれているソフト(R3040)ではないでしょうか。

  3. 将棋の神様同士の対局なら、香落ちだとしてもほぼ確実にその微差を終始活かして平手側が勝ちきりますよね。

    最強コンピュータが片方香落ちで自己対戦したら、勝率どのくらいになるのでしょうか。これが100%に近づけば、将棋の神様にも近いと言えるでしょうか。逆に100%にほど遠いようだと、まだまだ神様には及ばないと言えるでしょうか。

    そもそも、完全解析を前提に香落ちが必ず負けるゲームだとは限らないですが、仮に香落ちが勝つゲームだとしたら、それはそれで、角成らずの出る詰め将棋とか、打ち歩詰めがあるから後手必勝の逸話のような、夢の広がる話ではあります。

    • 香がないことを咎めようと思うとかなりの構想力が必要になりますよね…。コンピュータ将棋の通常探索ってそこまで網羅的に読んでないので、下手側、勝率100%にはなかなかならないような。

      駒落ち専用の評価関数をelmo式で学習させて良いなら香落ちを咎めるような駒の位置関係を発見するかも知れないですけども。

    • 同意です。
      以前なんとかちゃんねるで議論したところですが、
      高レートほど駒落ちの影響は大きくなることが容易に予想されますので、
      飛車落ち頭打ち現象は自然に思えます。

  4. uuunさんのところでも書かれてたように思いますが、飛車落ちになってくると下手側のRが一定以上になると上手側のRが高くなっていっても上手側が勝てなくなるみたいなデータがあったような?

    • 千田先生クラスなら将棋の神様相手でも飛車落ちなら100%勝てるとしても何ら不思議ではないですね。

      ただ、飛車落ち、そのへんのバランス的に結構際どいラインなのかも知れませんね。千田先生なら勝率100%だけど、平均的なプロ棋士だと勝率50%とかであってもおかしくなくて。

  5. プロ棋士が開発者に対して謙虚な気持ち
    で対戦する時代になりましたか!
    そういう意味では、藤井四段は「人間とcomとの対戦は終わった」
    とはっきり発言していますし、一番謙虚に将棋ソフト開発者に接していますし
    多くのプロ棋士連盟関係者も見習ってほしいですね!
    「人+物+金」あれば、どうにでもなると愚かな考えの人間(政治家、プロ棋士等)を、
    「エルモ+やねうら王」連合軍が勝利した事はAIの将来は明るいですね!

  6. GCEを利用して飛車落ちの対決をさせてみました。
    持ち時間は10秒
    上手:YaneuraOu 2017 Early KPPT 4.73 64AVX2 + relmo評価関数 + 24threads
    下手:YaneuraOu 2016 Mid KPPT 3.98 64AVX2 + 20151105(大樹の枝)評価関数 + 4threads
    上手は9000~14000kNPS程度、下手が2000~3000kNPS程度だったと思います。

    結果は上手から見て53-1-47(53勝47敗1持将棋)と、ほとんど互角でした。

    本当は大樹の枝と対決させてみたかったのですが、
    コンパイルして、plinkを使ってshogiGUIに登録まではいったのですが、動きませんでした。なので、やねうら王のバージョンを落としたものを利用して対決させてみました。

      • ああ、言われてみればそうでしたね…。悔しいので、以前に対決させてたものを載せます…。対戦数が少ないデータ+低スペックなので、あまり参考にならないかもしれませんが、手合いはすべて飛車落ちです。
        持ち時間1手15秒
        上手:V4.72+relmo+24threads
        下手:魔女1.24+20161010(真やねうら王)+2threads (700~1200kNPS)
        上手から見て14-0-3、
        持ち時間10秒
        上手:V4.72+mafu10+24threads
        下手:魔女1.24+20161010+2threads
        上手から見て13-0-4、
        持ち時間10秒
        上手:reepoch8+V4.68+2threads
        下手:Apery_WCSC25+2threads
        上手から見て30-0-31
        でした。

  7. 駒落ちの話題として…

    一般に香落ち、角落ち、飛車落ち、飛香落ち、二枚落ちという差の付け方をしますが、果たしてこの格差はおおむね等間隔だと言えるのでしょうか。

    素人考えでは、香落ちと角落ちの間に、桂落ちや銀落ち、または両香落ちなどがあってもよさそうにも思います。もちろん誰でも思いつくことなので、バランスが悪くて長い歴史の中で淘汰されていったのだとは思いますが。

    香落ち << (Rxxx差) << 角落ち << (Rxxx差) << 飛車落ち << (Rxxx差) << 飛香落ち << (Rxxx差) << 二枚落ち

    のように数字で示すことができるとおもしろいと思いました。しかし「飛車落ちの壁」があるとすれば、高いレベルではレーティング差が無限大になってしまうのですかね。だとすれば、上手側の強さをいくつかの段階に分けて算出しなければならない?

    • それでチェスのように(初手のみ)2手指しとか3手指しによるハンデをつけてもっと細かい駒落ちを作ったほうが良いのではというのが私が3年前(?)の電王戦の記者会見のときに言ったことで…。

  8. 駒落ちの対ソフト戦略とかもいろいろありそうですね。そういうのを研究するのはプロの仕事としてはどうかと思うので、電王に100万(飛車落ち)みたいなイベントをやって欲しいですね。将棋ウォーズにもポナ(飛車落ち)を放流してほしい。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です