角換わり腰掛け銀が終わりかねない件について

投稿日時: 2025年6月26日投稿者: やねうらお

先日、角換わり腰掛け銀で先手が69玉を経由せずに直接79玉～45桂と跳ねる仕掛けで千日手が結論ではないかという記事を書いた。

将棋AIの大会をめちゃめちゃにできる定跡が発見された
https://yaneuraou.yaneu.com/2025/06/21/a-game-breaking-opening-has-been-discovered/

これが千日手だとしたら、先手が簡単に誘導できる局面で千日手になる変化が発見されたことになり、また、この先の定跡をしっかり掘っておけば、実戦では相手が間違える可能性があるから、ワンチャン勝ちまであるというものだった。

将棋AIの大会で、中堅チームが上位チームにこの定跡をぶつけて、強制的に千日手にされてしまうと大会がめちゃめちゃになってしまう。

上の記事にあるように、この定跡の結論が千日手ではないかと最初に言い出したのは、水匠開発者のたややんさんだ。

たややんさんは、自前のスクリプトで定跡を生成されている。

このスクリプトは、置換表をクリアせずに連続対局するようになっている。

置換表とは、一度探索した局面の情報を蓄えておくテーブルのことだ。例えば、将棋ソフトを用いて棋譜解析を行うときに、棋譜の終わり(詰みの局面)から、初手に戻っていくように解析したほうが解析の精度が高いのに気づいている人もおられるだろう。

これは、棋譜の最後の変化で詰むことが置換表に書かれているため、逆から解析していくとそれを回避するような指し手が候補手に上がってくるためだ。

つまり、たややんさんの定跡スクリプトは、人生二周目みたいな感じで、前の人生で死亡する原因となった指し手のことを知っているから、それよりも、もっと良い指し手が指せるというわけである。

なかなか面白い仕組みではあるが、この手法にはいくつかの欠点がある。

まず、置換表に限りがあるということだ。

やねうら王系の置換表は情報がいっぱいになってくると価値の低い情報が上書きされて消されていくような仕組みとなっている。

だから、あまりに定跡生成時の手数が長いと終局までに置換表が溢れて古い情報は失われる。記憶の引き継ぎが中途半端なまま二周目を迎えるというわけだ。これだと何度でも同じ失敗に陥ることがある。

２つ目。終盤では、一見悪い評価値の指し手だけど、読み進めてみると好手であった、ということがありえる。(強いソフトだとそういう指し手の割合は減ってくるのだが、現状、まあまああるのが実態だ。)

たややんさんの手法だと、この「一見悪い評価値の指し手」が指せない。なぜなら、前の人生(1局前)でこの指し手を指した体験をしていないからだ。体験していないものは反省もできない。

この２つが、たややんさんの定跡スクリプトの大きな欠点と言えるだろう。

ただ、この「置換表をクリアせずに連続対局」させることで、少ない局面数を調べるだけで精度の高い定跡ができることでも知られている。人間が研究のために使うにはなかなか優秀な定跡生成手法だと思う。

それに対して、私の新ペタショック定跡のほうでは、各局面、ベストな指し手の評価値と、その指し手の評価値の差が一定(例えば100以内)の指し手を掘り進めていくようなアルゴリズムとなっている。(実際は、もう少し絞っているが、いまそこが問題ではないので割愛。)

なので、私のほうは、かなり網羅的に掘られていく。そのため、組み合わせ爆発のような状態になり、たややんさんのスクリプトとは桁違い(おそらく2桁以上違う)の局面を掘らないと結論が出せない。

そして、私も、今回の仕掛けの局面を課題局面と設定して、ここから定跡を掘ってみたが、(数万局面掘ったものの)いまだに結論が出せていない。組み合わせ爆発するほどでもないようだが、これは相当に複雑な変化のようだ。

そこに登場したのがあふろんさんの先手千日手怪物である。(「先手千日手怪物」の語感がおもろすぎる。)

私たちこのまま二人で先手千日手怪物になってこんな世界何もかもメチャクチャにしちゃおっか？嫌なことも悲しいことも全部無かったことにしちゃえるぐらい壊して壊して壊しまくってさ、それはそれでいいと思わない？ pic.twitter.com/DUwL2AJFSx
— あふろん@Grampus (@Grampus_ef) June 21, 2025

// 上の投稿は、言うまでもなく、まどマギの有名なシーンである。

あふろんさんは将棋AIの大会には「Grampus」や「東横将棋」として出場され、手動で巨大な定跡を編集されている。現代では数少ない定跡職人と言えるかも知れない。

そのあふろんさんが、この局面からの千日手に持ち込むまでの定跡を自身のソフトにインプットして、将棋AIの対局場であるfloodgateに投入した。

先手千日手怪物がハメ殺されている(　；∀；)(笑)
Sora_Ginko vs. KANROJI_MITSURI (2025-06-22 21:30) https://t.co/sg2rzbsq1S
— あふろん@Grampus (@Grampus_ef) June 22, 2025

先手千日手怪物()即死
Sora_Ginko vs. TEX_KATO (2025-06-24 16:30) https://t.co/2Cw71UnhDa pic.twitter.com/CI0rSOQ9TX
— あふろん@Grampus (@Grampus_ef) June 24, 2025

結果として、この仕掛けから後手勝ちの将棋がいくつか出てきた。先手千日手怪物になるのも容易ではなさそうである。

ここで、先手がただ単に千日手だけを狙うなら、本仕掛けの一手前の局面で、先手79玉～68玉の往復運動に対して後手42玉～52玉の往復運動だけで千日手が成立することは指摘しておく必要があるだろう。(いま将棋AI界隈のほとんどの定跡では後手はこれが最善になっていると思われる)

本仕掛け以降の定跡が興味深いのは、先手から高い確率で誘導できる仕掛けで、しかも変化の深さと幅がそこそこあり、簡単に定跡を掘りきれないが、組み合わせ爆発するほどでもないので頑張れば掘りきれそうという絶妙さ加減にある。

だから、大会のために掘るのに非常に適していて、これが掘りきれるかどうかが(将棋AI開発者自身の)自作の定跡スクリプトにとって良い試金石となるので、いま多くの開発者がこの仕掛けについて掘りきれるかチャレンジしているところである。dlshogiの山岡さんも、そのなかのお一人である。

そういう状況のなか、今日、山岡さんがとんでもない発言をされた。

山岡さん「dlshogiも定跡７９玉４５桂の定跡を掘っていますが、8.2万局面掘った時点で先手優勢のようです。」

以前にも少し書いたが、dlshogiは、定跡生成の時、1局面あたり、大会出場時の強さぐらいになる思考時間で掘っているらしい。大会時というのは、H100 8台で1手15秒とかなので、かなりのものだ。H100 1台で1局面2分相当だろうか。

dlshogiは(評価関数の)モデルの改良がかなり進んでいて、他のソフトと比べると桁違いに強いのに、H100で1手2分も費やされたのでは、同じ局面数であっても定跡自体の完成度が段違いである。(私のほうは、8.2万局面もまだ掘れていない上に、1局面あたりに費やしている計算資源も桁違いに少ないから比較にならない。)

そのdlshogiで(仕掛けの局面から)8.2万局面も掘って、先手優勢とのことである。

こんな角換わり腰掛け銀の必ず誘導できる局面が先手優勢とな…。

これだけで、もう将棋終わってしまうやんか。このあとの定跡、全部要らん話になってくるがな！

まったく、とんでもないことをしてくれたもんだな、たややん！(そこ？)

「角換わり腰掛け銀が終わりかねない件について」への3件のフィードバック

ysgeso 2025年7月3日 23:00 より:

abemaTVの将棋のタイトル戦の中継で評価値が50%と表示された時に、解説のプロ棋士の方がこれはもしかすると千日手を読んでいるのかもしれませんと解説していたのを見てもやっとしたのですが、その原因はミニマックス法で計算した評価値が50％だった場合（実際にはシグモイド関数で計算した値なので、元の値は0付近の値だと思います）は、以下の3種類の可能性があり、その区別が付けられないからだと思いました。

・終局まで読み切っていないが、どちらが優勢であるかの判断が付けられないため0付近の値を計算した
・終局まで読み切っていないが、千日手または持将棋による引き分けになることを確信して0付近の値を計算した
・千日手または持将棋になることを読み切って0を計算した

評価値がぴったり0になることはほとんどない（？）かもしれないので0になった場合は引き分けと考えて良いのかもしれませんが、そうでない0付近の値の場合は、どちらを意図して0付近の値を計算したかの区別が付けられないのではないかと思います。

今話題になっている千日手を調べる際に、その区別が付けられないことが問題になっていたりするのでしょうか？

また、詰みまで読んだ場合は、評価値の最大値に詰みまでの手数を加えるなどで、評価値に詰みまで後何手かという情報を入れることができるのに対して、引き分けを読んだ場合は後何手で引き分けになるかの情報を入れることもできない気がしました。

これらの点について、何か良い工夫はあったりするのでしょうか？また、この点についての話題を見たことがないのですが、これらは特に大きな問題とはなっていないということでしょうか？

返信 ↓
- やねうらお 2025年7月3日 23:07 より:
  
  出力しているPV(最善応手列 = 読み筋)が千日手かどうかを見ればわかるのではないかと…。
  あと、やねうら王では、千日手のPVのときは、PVの末尾に”rep_draw”と出力しています。(ShogiGUIでは、これに対応してて「千日手」と読み筋に出るはず)
  
  返信 ↓
  - ysgeso 2025年7月4日 23:35 より:
    
    お返事ありがとうございます。
    
    読み筋で千日手（持将棋でも同様です）かどうかが分かるという点、確かに千日手まで読み切った場合は納得です。後何手で千日手になるかの判断ができるかどうかという疑問は解消できました。
    
    一方、千日手に至る局面までの手数が長く、千日手まで読み切れなかった場合のことがまだよくわかりません。
    
    例えば今話題になっている局面（以後Ａと表記します）が、今後結論としてお互いが最善手を続けた場合に千日手になる局面だとわかった場合、今はまだありませんがいつかはつよつよ静的評価関数ができて、局面Ａを千日手になる局面だと判断して評価値0（または0に近い値）を計算する時が来るのではないかと思うのです。
    
    その時、Ａより前の局面Ｂに対してＡＩが計算した読み筋がＡの局面で終わっている場合は、評価値として0が計算されるのではないかと思います。その場合に、Ｂの局面に対して計算された評価値０は、Aが千日手に至る前の局面なので、読み筋を見ても千日手であることを意図した0であるのか、互角（どちらが優勢であるか不明）であることを意図した0であるのかの区別がつかないのではないかという疑問でした。
    
    今回の騒動を見るまではその２つの区別をつけれなくてもAIの強さには影響しないのだから、そもそも区別をつける必要はないのではないかと思っていたのですが、今回の騒動を見て千日手まで読み切れていない場合でも、評価値0から千日手に至る局面であるかどうかを区別できるのってもしかすると重要なんじゃないか？と思ったというのもあります。
    
    返信 ↓

やねうら王公式サイト

コンピューター将棋やねうら王公式サイト

角換わり腰掛け銀が終わりかねない件について

「角換わり腰掛け銀が終わりかねない件について」への3件のフィードバック

コメントを残すコメントをキャンセル

「角換わり腰掛け銀が終わりかねない件について」への3件のフィードバック

コメントを残す コメントをキャンセル

コメントを残すコメントをキャンセル