Ponanzaの初手78金、そして相横歩取りでの77歩打。プロ棋士が5時間の持ち時間で初手78金や77歩打を咎められないというのもまた驚き。
そして、後手の74飛と飛車をぶつけられたときのPonanzaの36飛。56飛といったん停止して42銀とさせて(飛車の打ち込みに弱くして)の86飛。驚愕の指し手の連続。そして、この変化でどうも後手が少し悪そうというのが、また驚き。
あと後手が横歩を取った時点でPonanzaの定跡が3択(77桂、77銀、77歩)なので、早い段階でこんなにゲームツリーが広くなるような変化に飛び込むのは人間側がすこぶる損でしょう。ゲーム攻略として見るなら、このへんの後手の指し手は最悪の指し手であり最悪の進行です。
とは言え、プロ棋士にゲーム攻略のような攻略の仕方をして欲しいとは私は思わないので、村山先生を非難するつもりは全くありません。
村山先生が正面からぶつかってこられたからこそ、Ponanzaの人智を超えた指し手が見れたわけですし…。
コンピュータ将棋が、また一つ常識を覆してしまった
人知を超えた構想力、馬を作って良しという大局観
また馬を作ってからも素晴らしい指し回しでした
特に5二玉型に対して左辺を攻めるのではなく、飛車を引いて右桂を使う構想がすごかったです
広い玉に対して駒が少ない中で手をつないでいく攻めの技術の高さ
自玉の安全度をギリギリで見極める読みの確かさ
人間には真似のできない正確な差し回し
これぞコンピュータ将棋という素晴らしい将棋でした
いや、ほんとそれ。
ところで、やねさんは2週間で今年のバージョンを作ったということですが、山本さんはわりと年中改良に取り組んでポナンザ強くならんってよくつぶやいてる印象で、なんか対照的だなって思いました。
そこで質問なのですが、たった2週間で1年改良を続けてるポナンザの下の順位につけられるって、具体的にどのような改良を行ったんでしょうか?(ここ1年で発表された有力な手法を全部実装したとか?)
あと、山本さん的にも色々やって強くならないと改良に苦労してるみたいですが、やねさん的にはソフトを強くできる隠しアイデアみたいなのがまだまだある感じなんですかね?
2週間で出来ることはたかが知れてます…(´ω`)
まあ今年も電王トーナメントがあるなら例によって2週間ほどだけ取り組んでR200ぐらいは上げる予定ではありますが…。(上がるかどうかはわかりません)
サクっと言うやねさんさすがです(笑
超効率的な”短距離走”がお得意のジョブスタイルなのは良くわかりますが、やねうら王定跡充実の為にはもう少し時間があった方がよろしいのでは、、、といらぬおせっかいを言いたくなるのでありました。
棋譜しかみていないので判らないのですが、56飛を、ponanza は、自力で指したのでしょうか。それなら、すごいと思います。
Bonanzaの定跡には56飛までの手順が入っていました。
56歩は思考してたので自力ですね。
ponanzaは、羽生三冠を超えている。
寂しい気もしますが・・・
いつかはと思っていましたが、とうとう、チェスに続き、
将棋も人間を明確に超えてしまいましたね。
そもそも今回もハンディキャップ(事前貸出)ありですしね・・・
僕の今後の興味は神の一手はどのような手になるのかです。
振り飛車や居飛車等の戦型、囲い。
今後のトップソフト同士の対局が楽しみです。
77歩を指す可能性があることを知ってて
あの対策では私ははっきり言ってプロ棋士として
恥ずかしいことだと思います。
序盤で苦しくなってそのまま負けるなんて
貸出してる意味がわかりません。
村山さんにはがっかりしました。
プロ棋士側には序盤の生起確率の低い変化は切り捨てないと深くまで研究できないという問題があって(深くまで研究しないと研究の成果が生きませんし…)、まあ、36飛の変化はあまり出ないし、ばっさり切り捨てていたのでしょう…。
棋士はどうも全体的なコンセンサスが取れすぎて枠内で戦っている印象を受けます。
もうちょっと汎用性があってもいいと思うのですが、彼らはやっぱ職人なのでしょうかね。
自分はPG思考してると思うのですが彼らとはわかちあえないのでしょうか。
将棋の初手はいろいろ考えられますが、直接咎めに行くのは難しいですね。初手▲1八香と指しても1手パスにしかなりませんし、振り穴を目指すなら有効手にもなり得ます。
逆に一番ひどい初手は何だと思いますか?
一番ひどい手は86歩ではないでしょうか。最善を尽くせばいきなり形勢は損ねませんが、長期的にはかなりの負担になります。
全く同感です!と、ウォーズで角頭歩戦法を使いまくっている自分が言ってみるw
>一番ひどい手は86歩ではないでしょうか。
質問させてください。
その一番ひどい手をやねうら王は独力で発見できるのでありましょうか?
初期局面で、MultiPV = 1000とかにして一番評価値の低い指し手を見ればいいんですね..。(いまMultiPV時に読み筋を綺麗に出力する機能はつけてないので、そのへん改造したのちに)今度やってみますので…。
いっぱいたまっている「やることリスト」に追加しておいて下さいませ。
研究報告、期待しております。
電王戦は単なるゲームではなく、すべての棋士を将棋ソフトが超えたことを人々が受け入れるための儀式でもあるんですね。まだ受け入れてない人がプロ棋士の中にもいるみたいですが…
なるほど、儀式なんですね…。
出遅れ感が満載のコメントになりますが、、、。
件のPonanza 56飛について、山本さんがTwitterで出現理由を言及していらっしゃいましたね。
「スレッドのスケジューリングなど並列化に伴う、微妙な動作の違い」
「将棋プログラムの並列化は高速化のため極力同期的な操作をしないため探索結果の同一性がなかなかない」
とのことですが、プログラムに疎い私には不思議な感じがします。
並列化処理の同期を取ることが結果の再現性を決めるということなんでしょうか?
それとも並列化処理自体が実はmarginal stability(極めてきわどい条件で安定性が成り立っている)のでしょうか?
いずれにせよハードウェア(CPU)ベースの処理から生じているようですので、松本さんの著書で拝見したやねうらおさんの目指すアプローチとは異なる話題かもしれませんが、、、。
もっとプログラムの勉強をしなくてはと思っています。
能力が全く同じの8人で短距離走をすることを考えてください。
その中で1位になる人のは誰でしょうか。
非同期とは大体そういう事です。
同期とは、途中の地点で一回8人全員が到達したことを確認してからまた競争を始めます。
つまり、非同期とは、律速するものがほぼないので追い越し追い越されを繰り返すのです。
それが、ある結果がとある時点のベターケースに比べて何個か答えが多く出たり、少なく出たりする要因です。
速度に差が出るのは、メモリを書き込むときにバリアを張らないといけないので(そういう規則です。)その間はまわりが止まったり止まらなかったりします。
> 並列化処理の同期を取ることが結果の再現性を決めるということなんでしょうか?
はい。完全に同期を取れば再現性のある結果(毎回同じ結果)になります。完全に同期を取るコストが馬鹿にならないので、ゲーム木探索のプログラムでは実際はそうは実装しません。その結果、再現性はなくなります。
> それとも並列化処理自体が実はmarginal stability(極めてきわどい条件で安定性が成り立っている)のでしょうか?
将棋のようなゲーム木を並列探索するなら、結果の再現性はなくともそこまで悪手が選ばれることはないです。(普通にシングルスレッドで探索するよりはマルチスレッドで並列探索したほうが棋力は上がることは実証されています。) これがmarginal stabilityに該当するのかどうかは私にはよくわかりませんが…。
やっぱりカオス系そのものではないでしょうか?
カオス系を未来予測しコントロールしようなどというのは「神をも恐れぬ所業」かと、、、。
やねうらおさん、Yakitoriさん、丁寧に説明していただき、有難うございます。
将棋ソフトのようなゲーム木探索のプログラムでは、並列探索を非同期で実行することで(計算)コストを抑えているんですね。
その上で能力が全く同じ(仕様の)8コア間で生じた、非常にわずかな演算結果のばらつきが、結果としてマクロな出力としてあの手を選択することに繋がったいうのが山本さんのご見解なんですね。
今まで私の中で「定常性」ばかり意識していたコンピュータ処理について、イメージできていなかった一面を垣間みることができたように思います。
本当に奥が深いですね。
どこを切ってもスッキリ感のなかった電脳戦ファイナルですが、
一度、一局一週間位かけて、秒読み15分~20分で、五局並列で、各々三番勝負を貸出しなしでやってほしいかなと。
ハードは今より少々の増強は良いでしょう。
スホンサーその他の問題はありましょうが、今回は、あまりにも不満がくすぶったようですので、ぜひお願いしたいところです。