先日、角換わり腰掛け銀で先手が69玉を経由せずに直接79玉~45桂と跳ねる仕掛けで千日手が結論ではないかという記事を書いた。
将棋AIの大会をめちゃめちゃにできる定跡が発見された
https://yaneuraou.yaneu.com/2025/06/21/a-game-breaking-opening-has-been-discovered/
これが千日手だとしたら、先手が簡単に誘導できる局面で千日手になる変化が発見されたことになり、また、この先の定跡をしっかり掘っておけば、実戦では相手が間違える可能性があるから、ワンチャン勝ちまであるというものだった。
将棋AIの大会で、中堅チームが上位チームにこの定跡をぶつけて、強制的に千日手にされてしまうと大会がめちゃめちゃになってしまう。
上の記事にあるように、この定跡の結論が千日手ではないかと最初に言い出したのは、水匠開発者のたややんさんだ。
たややんさんは、自前のスクリプトで定跡を生成されている。
このスクリプトは、置換表をクリアせずに連続対局するようになっている。
置換表とは、一度探索した局面の情報を蓄えておくテーブルのことだ。例えば、将棋ソフトを用いて棋譜解析を行うときに、棋譜の終わり(詰みの局面)から、初手に戻っていくように解析したほうが解析の精度が高いのに気づいている人もおられるだろう。
これは、棋譜の最後の変化で詰むことが置換表に書かれているため、逆から解析していくとそれを回避するような指し手が候補手に上がってくるためだ。
つまり、たややんさんの定跡スクリプトは、人生二周目みたいな感じで、前の人生で死亡する原因となった指し手のことを知っているから、それよりも、もっと良い指し手が指せるというわけである。
なかなか面白い仕組みではあるが、この手法にはいくつかの欠点がある。
まず、置換表に限りがあるということだ。
やねうら王系の置換表は情報がいっぱいになってくると価値の低い情報が上書きされて消されていくような仕組みとなっている。
だから、あまりに定跡生成時の手数が長いと終局までに置換表が溢れて古い情報は失われる。記憶の引き継ぎが中途半端なまま二周目を迎えるというわけだ。これだと何度でも同じ失敗に陥ることがある。
2つ目。終盤では、一見悪い評価値の指し手だけど、読み進めてみると好手であった、ということがありえる。(強いソフトだとそういう指し手の割合は減ってくるのだが、現状、まあまああるのが実態だ。)
たややんさんの手法だと、この「一見悪い評価値の指し手」が指せない。なぜなら、前の人生(1局前)でこの指し手を指した体験をしていないからだ。体験していないものは反省もできない。
この2つが、たややんさんの定跡スクリプトの大きな欠点と言えるだろう。
ただ、この「置換表をクリアせずに連続対局」させることで、少ない局面数を調べるだけで精度の高い定跡ができることでも知られている。人間が研究のために使うにはなかなか優秀な定跡生成手法だと思う。
それに対して、私の新ペタショック定跡のほうでは、各局面、ベストな指し手の評価値と、その指し手の評価値の差が一定(例えば100以内)の指し手を掘り進めていくようなアルゴリズムとなっている。(実際は、もう少し絞っているが、いまそこが問題ではないので割愛。)
なので、私のほうは、かなり網羅的に掘られていく。そのため、組み合わせ爆発のような状態になり、たややんさんのスクリプトとは桁違い(おそらく2桁以上違う)の局面を掘らないと結論が出せない。
そして、私も、今回の仕掛けの局面を課題局面と設定して、ここから定跡を掘ってみたが、(数万局面掘ったものの)いまだに結論が出せていない。組み合わせ爆発するほどでもないようだが、これは相当に複雑な変化のようだ。
そこに登場したのがあふろんさんの先手千日手怪物である。(「先手千日手怪物」の語感がおもろすぎる。)
// 上の投稿は、言うまでもなく、まどマギの有名なシーンである。
あふろんさんは将棋AIの大会には「Grampus」や「東横将棋」として出場され、手動で巨大な定跡を編集されている。現代では数少ない定跡職人と言えるかも知れない。
そのあふろんさんが、この局面からの千日手に持ち込むまでの定跡を自身のソフトにインプットして、将棋AIの対局場であるfloodgateに投入した。
結果として、この仕掛けから後手勝ちの将棋がいくつか出てきた。先手千日手怪物になるのも容易ではなさそうである。
ここで、先手がただ単に千日手だけを狙うなら、本仕掛けの一手前の局面で、先手79玉~68玉の往復運動に対して後手42玉~52玉の往復運動だけで千日手が成立することは指摘しておく必要があるだろう。(いま将棋AI界隈のほとんどの定跡では後手はこれが最善になっていると思われる)
本仕掛け以降の定跡が興味深いのは、先手から高い確率で誘導できる仕掛けで、しかも変化の深さと幅がそこそこあり、簡単に定跡を掘りきれないが、組み合わせ爆発するほどでもないので頑張れば掘りきれそうという絶妙さ加減にある。
だから、大会のために掘るのに非常に適していて、これが掘りきれるかどうかが(将棋AI開発者自身の)自作の定跡スクリプトにとって良い試金石となるので、いま多くの開発者がこの仕掛けについて掘りきれるかチャレンジしているところである。dlshogiの山岡さんも、そのなかのお一人である。
そういう状況のなか、今日、山岡さんがとんでもない発言をされた。
山岡さん「dlshogiも定跡79玉45桂の定跡を掘っていますが、8.2万局面掘った時点で先手優勢のようです。」
以前にも少し書いたが、dlshogiは、定跡生成の時、1局面あたり、大会出場時の強さぐらいになる思考時間で掘っているらしい。大会時というのは、H100 8台で1手15秒とかなので、かなりのものだ。H100 1台で1局面2分相当だろうか。
dlshogiは(評価関数の)モデルの改良がかなり進んでいて、他のソフトと比べると桁違いに強いのに、H100で1手2分も費やされたのでは、同じ局面数であっても定跡自体の完成度が段違いである。(私のほうは、8.2万局面もまだ掘れていない上に、1局面あたりに費やしている計算資源も桁違いに少ないから比較にならない。)
そのdlshogiで(仕掛けの局面から)8.2万局面も掘って、先手優勢とのことである。
こんな角換わり腰掛け銀の必ず誘導できる局面が先手優勢とな…。
これだけで、もう将棋終わってしまうやんか。このあとの定跡、全部要らん話になってくるがな!
まったく、とんでもないことをしてくれたもんだな、たややん!(そこ?)