最新の将棋ソフトが2手目34歩を悪手だと言い始めた件

近年の将棋ソフトは2倍の思考時間を使えばR200程度強くなる。ということは、家庭用PCで15分切れ負けの対局でR4300程度だと言われている最新ソフトを自己対局させるとして、片方のソフトだけ持ち時間をその倍である30分を与えるとどうなるだろう?

そのソフトは、見かけ上、R4300 + R200 = R4500ぐらいの強さを発揮するわけであるな。

では、もっと桁違いの時間を与えるとどうだろう?

15分切れ負けのとき、序盤の1手には10秒ぐらいしか使わないが、その序盤の特定の局面に対して、1,000倍の時間(10,000秒)を与えれば、そのときの棋力はどれだけになるだろう?

log(2)1024 = 10なので、10×R200 = +R2000ぐらい強くなり、R4300 + R2000 = R6300のソフト相当になるのではなかろうか。

R6300のインパクトが強すぎてどれくらいの強さなのか想像もつかない。いかにソフトの序盤にまだ甘いところがあると言え、R6300もあれば、ある程度信用できるのではなかろうか。

※ 参考:プロ棋士がR3000付近、最新ソフトがR4300付近、AlphaZeroがR4500付近。

そんななか、最新のソフトが後手の角換わりを避ける傾向があることがわかってきた。

なんとかちゃんねるのコンピュータ将棋のスレには、2手目の34歩に関して興味深い書き込みが散見される。

2手目の34歩、長い時間ソフトに検討させた時に最善手との評価値の差が50ぐらいあるようなのだ。
評価値の差も10や20なら誤差かなと思えなくもないが、50もあると…。

あと、初手76歩が26歩や78金より悪いだとか…。こちらについては評価値の差はさほどないので誤差かも知れないが、もし本当だとしたら将棋の常識が覆りそう。

最新の将棋ソフトが2手目34歩を悪手だと言い始めた件」への18件のフィードバック

      • 昨年の選手権とGPWで序盤定跡絡みでそのネタ言ってたんですが,棋士に真に受けられると困る感があって冗談っぽくしか言えないんですよ。
        shotgunの対技巧勝率が96%だけど,その4%は後手で2手目か4手目で34歩って話です。

  1. >あと、初手76歩が26歩や78金より悪いだとか…。こちらについては評価値の差はさほどないので誤差かも知れないが、もし本当だとしたら将棋の常識が覆りそう。

    先手が居飛車党だとして(2手目84歩のときに)
    初手76歩→角換わりor矢倉 志向
    初手26歩→角換わりor相掛かり 志向

    ソフトは相掛かりを好む?
    しかし人間的には研究しやすい角換わりのほうが先手の利を生かしやすい(かも)

  2. ノード数増えても思考時間2倍にしたらノード数って2倍になるんですか?500億ノードで深度ってどれくらいなんですか?

  3. WCSC28で30億NPS越えのクジラちゃんはSlowMoverの設定ミスって序盤の1手に何兆ノードも読んだけど結局100億ノードぐらいで迷ってた2手を最後まで迷い続けてた。(結局どうでもいい端歩を最善とかほざいて)

    なので500億ノードそこらじゃ再序盤の手で優勢・劣勢になる局面まで絶対に探索できない。枝刈りでだいぶ漏れもあるだろうし。

    「不利飛車」だの「後手番角換わり終了」だの「将棋の結論に近づいた」だの、枝刈り無しのMiniMaxでDepth50ぐらい探索できてから言って欲しいものだ。

    wcsc28は200手以上の将棋が多かったが、200手の将棋においてDepth30~40程度じゃ長くて真っ暗なトンネルを入り口からちょこっと覗いてる程度でしかない。

    深い探索で出た評価値を浅い探索にコミットさせるような学習じゃ思い込みで排除した手はどんどん排除されていい形だと思い込んでる手はどんどん学習されてく。振り飛車は不利だと思い込んで降った直後に-300とか言ってるから枝刈りで読み抜けするし60手後ぐらいに互角に戻ってる。

    あと、プロ棋士がR3000付近、最新ソフトがR4300付近って書いてるが、R4300なのは定跡無しポンダー無しApery_twigで1手1500万ノードで対局した時の棋力をR3250とした場合であって、比較のしようはないが電王戦などで発揮されたパフォーマンス(クラスタ+ポンダー+定跡)は1500万ノード定跡なしのillqhaとかにも勝つでしょう。プロ棋士をR3000って言ってるのはおそらく電王戦でソフトがプロに勝つようになった頃のソフトのレートとか藤井聡太七段のインタビューを参照してるんだろうけど、藤井聡太七段がソフト利用時ソフトにたった1500万ノードしか読ませなかったとは思えないし、藤井聡太七段の持ち時間についても不明。
    持ち時間を倍にして+R200とか言ってるが持ち時間が伸びることで棋力が上昇するのは人間も同じなのにソフト側だけ1000倍にしてR6300とか言ってプロ棋士には1500万ノード(5秒相当)のレートを出してて不平等

    (これはやねさんへの批判ではなく一般的にソフトを過信して「不利飛車」だの「戦型ゲー」だの「プロ棋士とか雑魚」だの言ってる人たちへの批判)

    • > なので500億ノードそこらじゃ再序盤の手で優勢・劣勢になる局面まで絶対に探索できない。枝刈りでだいぶ漏れもあるだろうし。

      100台で500億ノードで調べても台数のダブルルート(√√100 = √10 ≒ 3.16 倍)ぐらいの効果しかないので、シングルスレッド換算で 500億/100×3.16 = 15.8億ノード相当だというのはありますね…。

  4. これって、後手の時点で0.5手を損してるようなものなのに、1手損みたいな名前の付くことさえある戦法なんかできるかバーカというのが評価値の50差というイメージでいいのかな?w

    • 後手の時点で0.5手を損してるようなものとか決め打ちで書いたのに、じゃあ後手でも勝てるのはなんでと考えたときに、相手の駒を取って自分の駒として好きなところに打てるという部分で、相手の数手を潰した上で自分の数手を省略できるという得が発生するから、というイメージでいいのかな?w

  5. 嘘やんとしか言えない、いや理屈はわかるけど青野流強いし振り飛車はまずいし・・・・。
    生きてるうちに2手目の成否が問われることが起きるなんて考えたことなかった(´・ω・`)

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です