近年の将棋ソフトは2倍の思考時間を使えばR200程度強くなる。ということは、家庭用PCで15分切れ負けの対局でR4300程度だと言われている最新ソフトを自己対局させるとして、片方のソフトだけ持ち時間をその倍である30分を与えるとどうなるだろう?
そのソフトは、見かけ上、R4300 + R200 = R4500ぐらいの強さを発揮するわけであるな。
では、もっと桁違いの時間を与えるとどうだろう?
15分切れ負けのとき、序盤の1手には10秒ぐらいしか使わないが、その序盤の特定の局面に対して、1,000倍の時間(10,000秒)を与えれば、そのときの棋力はどれだけになるだろう?
log(2)1024 = 10なので、10×R200 = +R2000ぐらい強くなり、R4300 + R2000 = R6300のソフト相当になるのではなかろうか。
R6300のインパクトが強すぎてどれくらいの強さなのか想像もつかない。いかにソフトの序盤にまだ甘いところがあると言え、R6300もあれば、ある程度信用できるのではなかろうか。
※ 参考:プロ棋士がR3000付近、最新ソフトがR4300付近、AlphaZeroがR4500付近。
そんななか、最新のソフトが後手の角換わりを避ける傾向があることがわかってきた。
WCSC29参加予定の水匠は、現在、後手番で角換わりをほぼ指さず、他の有力戦法を学習した気がします。
本番でどこまで通用するか、楽しみです!— たややん@NNUEkai (@tayayan_ts) April 13, 2019
なんとかちゃんねるのコンピュータ将棋のスレには、2手目の34歩に関して興味深い書き込みが散見される。
2手目の34歩、長い時間ソフトに検討させた時に最善手との評価値の差が50ぐらいあるようなのだ。
評価値の差も10や20なら誤差かなと思えなくもないが、50もあると…。
あと、初手76歩が26歩や78金より悪いだとか…。こちらについては評価値の差はさほどないので誤差かも知れないが、もし本当だとしたら将棋の常識が覆りそう。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 |
646名無し名人 (ワッチョイ 0b68-3NsW)2019/04/14(日) 00:13:12.96ID:o+6I8uFK0>>648>>649 最新ソフトで開始局面から初手26歩の局面で200億ノード探索、上位4手 84歩 -59 32金 -59 62銀 -88 34歩 -126 34歩だけ悪すぎない?34歩って32金や62銀より悪いの?この結果っておかしい? まだ探索量足りない? 650名無し名人 (ワッチョイ 9335-clLQ)2019/04/14(日) 00:26:50.80ID:MdoQPDCk0 確かalphazeroは二手目に角道開ける△34歩(▲2六歩△3四歩と▲7六歩△3四歩)は両方ともわりと 早い段階で選択しなくなってたよね。 後手の作戦が横歩取り、雁木系、一手損角換わり、振り飛車くらいで 二手目に飛車先つくのに比べたら勝率が悪かったんだろうね。 652名無し名人 (ワッチョイ 992d-La48)2019/04/14(日) 00:32:06.69ID:cLWaHZOG0 まずalphazeroは初手76歩は不利だから?なのか知らんが指さない。26歩か78金のみ。 elmo先手はすべて76歩だけどそれに対して84歩が大半、もしくは32金 またalphazeroは初手26歩への最善も84歩と考えているみたい(Frequency in Self-Play) 651名無し名人 (ワッチョイ 0b68-3NsW)2019/04/14(日) 00:31:58.29ID:o+6I8uFK0>>661 ちなみに初手76歩に対しては 84歩 -59 32金 -59 62銀 -88 34歩 -101 こうなってる 34歩、そんなに駄目なのか・・ 668名無し名人 (ワッチョイ 0b68-3NsW)2019/04/14(日) 09:51:26.30ID:o+6I8uFK0 >>652 > まずalphazeroは初手76歩は不利だから?なのか知らんが指さない。26歩か78金のみ。 ちなみに俺のほうでは、初期局面、いまのところ以下のようになっている。500億ノード相当。 26歩 53 78金 51 76歩 42 16歩 16 96歩 14 48銀 8 36歩 6 |
振り飛車がダメ、横歩取りも青野流にされてダメということになると「そもそも二手目△34歩」がダメというところに行きつくんだろう。ただ、これはあくまでも将棋AIの話。人間レベルならダメではない。 https://t.co/fWcWkUa94l
— logimon (@logical0630) April 14, 2019
34歩以外の2手目も十分な局数学習したら-200ぐらいに落ち着くと思う知らんけど
MultiPVで上位N手を出しているのでそれはないかと。
藤井聡太も2手目は84歩しか指さないよ
藤井聡太さんに、いつかその意図を聞いてみたいですね…。
昨年の選手権とGPWで序盤定跡絡みでそのネタ言ってたんですが,棋士に真に受けられると困る感があって冗談っぽくしか言えないんですよ。
shotgunの対技巧勝率が96%だけど,その4%は後手で2手目か4手目で34歩って話です。
なるほど。まあ、私のほうも思う所あって、本日100テラショック定跡公開しました。(`・ω・´)b
>あと、初手76歩が26歩や78金より悪いだとか…。こちらについては評価値の差はさほどないので誤差かも知れないが、もし本当だとしたら将棋の常識が覆りそう。
先手が居飛車党だとして(2手目84歩のときに)
初手76歩→角換わりor矢倉 志向
初手26歩→角換わりor相掛かり 志向
ソフトは相掛かりを好む?
しかし人間的には研究しやすい角換わりのほうが先手の利を生かしやすい(かも)
ノード数増えても思考時間2倍にしたらノード数って2倍になるんですか?500億ノードで深度ってどれくらいなんですか?
500億ノードはdepth 40いくつでしょうね…。
相掛かりの時代が来るんですかね
WCSC28で30億NPS越えのクジラちゃんはSlowMoverの設定ミスって序盤の1手に何兆ノードも読んだけど結局100億ノードぐらいで迷ってた2手を最後まで迷い続けてた。(結局どうでもいい端歩を最善とかほざいて)
なので500億ノードそこらじゃ再序盤の手で優勢・劣勢になる局面まで絶対に探索できない。枝刈りでだいぶ漏れもあるだろうし。
「不利飛車」だの「後手番角換わり終了」だの「将棋の結論に近づいた」だの、枝刈り無しのMiniMaxでDepth50ぐらい探索できてから言って欲しいものだ。
wcsc28は200手以上の将棋が多かったが、200手の将棋においてDepth30~40程度じゃ長くて真っ暗なトンネルを入り口からちょこっと覗いてる程度でしかない。
深い探索で出た評価値を浅い探索にコミットさせるような学習じゃ思い込みで排除した手はどんどん排除されていい形だと思い込んでる手はどんどん学習されてく。振り飛車は不利だと思い込んで降った直後に-300とか言ってるから枝刈りで読み抜けするし60手後ぐらいに互角に戻ってる。
あと、プロ棋士がR3000付近、最新ソフトがR4300付近って書いてるが、R4300なのは定跡無しポンダー無しApery_twigで1手1500万ノードで対局した時の棋力をR3250とした場合であって、比較のしようはないが電王戦などで発揮されたパフォーマンス(クラスタ+ポンダー+定跡)は1500万ノード定跡なしのillqhaとかにも勝つでしょう。プロ棋士をR3000って言ってるのはおそらく電王戦でソフトがプロに勝つようになった頃のソフトのレートとか藤井聡太七段のインタビューを参照してるんだろうけど、藤井聡太七段がソフト利用時ソフトにたった1500万ノードしか読ませなかったとは思えないし、藤井聡太七段の持ち時間についても不明。
持ち時間を倍にして+R200とか言ってるが持ち時間が伸びることで棋力が上昇するのは人間も同じなのにソフト側だけ1000倍にしてR6300とか言ってプロ棋士には1500万ノード(5秒相当)のレートを出してて不平等
(これはやねさんへの批判ではなく一般的にソフトを過信して「不利飛車」だの「戦型ゲー」だの「プロ棋士とか雑魚」だの言ってる人たちへの批判)
> なので500億ノードそこらじゃ再序盤の手で優勢・劣勢になる局面まで絶対に探索できない。枝刈りでだいぶ漏れもあるだろうし。
100台で500億ノードで調べても台数のダブルルート(√√100 = √10 ≒ 3.16 倍)ぐらいの効果しかないので、シングルスレッド換算で 500億/100×3.16 = 15.8億ノード相当だというのはありますね…。
2手目の34歩から局面をスタートさせたら勝率はどれぐらいなのだろうか
ロタさんの計測ではR70程度の差になるようです。
これって、後手の時点で0.5手を損してるようなものなのに、1手損みたいな名前の付くことさえある戦法なんかできるかバーカというのが評価値の50差というイメージでいいのかな?w
そういや、コンピュータは一手損角換わり、あんまりやりませんね…。
後手の時点で0.5手を損してるようなものとか決め打ちで書いたのに、じゃあ後手でも勝てるのはなんでと考えたときに、相手の駒を取って自分の駒として好きなところに打てるという部分で、相手の数手を潰した上で自分の数手を省略できるという得が発生するから、というイメージでいいのかな?w
嘘やんとしか言えない、いや理屈はわかるけど青野流強いし振り飛車はまずいし・・・・。
生きてるうちに2手目の成否が問われることが起きるなんて考えたことなかった(´・ω・`)