王手将棋用の評価関数ファイルV2を公開して、わずか数時間で必勝法を見つけてこのブログにコメントをくださった人がいた。本当、インターネットは凄い人博覧会である。これには参った。
V2は、強さで言うとR3190相当のはずである。それなのにこんなに簡単に必勝法が見つかるのか。それとも、王手将棋は頓死筋が多いため、長期的な戦略を立てられる人間に有利なゲームなのだろうか。
悩んでいても仕方がない。やねうら王手将棋(呼びやすくてこの略称、気に入った)は、人類が手の届かないところまで突き進むしかない。
本日は、V2から+R410(前バージョンに勝率9割超え!)強くなったV3を公開する。
王手将棋用評価関数ファイルV3
https://drive.google.com/open?id=0Bzbi5rbfN85NVGJ3eHNtaHZhLXc
※ 駒得のみの評価関数(R2400相当) → 真やねうら王の評価関数(+R150) → V1(+R300) → V2(+R340) → V3(+R410) = R3600相当
正直、何がどう強くなっているのか私には全くわからない。わからないが、前のバージョンに9割勝つということしか私には言えない。9割も勝つ以上、前バージョンのハマりパターンぐらい自力で回避するんでしょ?と思うのだが、そうでもないようで、その直前の局面まで進めて自ら思考させても頓死筋には気がつかないようである。
ただ、序盤の指し方が変わったので、その局面自体に誘導することは出来ないようだ。やねうら王手将棋は、角道を止める指し手が感覚的に良くないことを覚えたのだろう。何とも不思議だが、強くなるというのはそういうことなのかも知れない。
人間でも何かを変えるのは閃きだったりしますよね。
それが何らかの分岐点なんじゃないでしょうか。
それを知ってる世界と知らない世界が平行していて突然フリップする瞬間。
なかなか刺激的ですよね。
真夜中のポエム、怖杉内科
迷惑ですか?
枯れ木も山のにぎわいという言葉がありましてな…。
落ち葉が肥料になればいいんですけどねぇ。
そこまで栄養価がありますかどうか。
まぁ、一応居座り続けますよ。
後手がやねうら王手将棋(V3)(10秒4スレッド)
▲2六歩△3二金▲2五歩△4二銀▲2四歩△同 歩
▲同 飛△2三歩▲2六飛△8四歩▲5六飛△5二金
▲6八銀△8五歩▲4八銀(△8四飛※)▲9六歩-
-△2四飛▲3九金△XXXXXX▲9七角…で勝勢
-△6二銀 ▲9七角△6四歩▲7五角△7四飛
▲6六角△8六歩▲5五飛△8七歩成▲8五飛
△8四歩▲8七飛△XXXXXX▲8二歩…で勝勢
※まれに△4四歩を指す。このときは
▲9六歩△6二銀▲9七角△8六歩▲同角△6四歩
▲7八金△4一玉▲6六飛△XXXXXX▲6四角…で勝ち(?)
この手順は環境によってぶれそうな気もしますが、私の環境ではうまくいきました。
ソフト側の手順前後は基本無視で指すといずれ合流すると思います。
なにー!!もう必勝手順を見つけた…だと…。これはまたバージョンアップしないといけませんわー。(´ω`)
前Verから9割勝つソフトに9割勝つソフトは、ちゃんと最初のやつに9.9割勝つようになるものなんですか?
R = -400・log(1/勝率 -1)として、9割勝つとR381.7。
9割勝つソフトに9割勝つのは、この倍でR763.4。上式から勝率を計算すると..98%ちょっとぐらいなのでは..。
98%勝つのかどうかは…まあ、実際には頓死があったりしてなかなかその計算通りにはならないですね…。
ソフト先手8スレ10秒の時、3割位の確率で以下の展開になります。
先手:YaneuraOu Check Shogi KPPT 4.14 64AVX2
後手:人間
▲2六歩△8四歩▲2五歩△3二金▲7六歩△4二銀
▲2四歩△同 歩▲同 飛△2三歩▲2五飛△8五歩
▲7七角△6二銀▲6八銀△3四歩▲6六歩△8四飛
▲4八銀△4四角▲2四歩△3三桂▲2八飛△2四歩
▲同 飛△3一金▲7八金△5四飛▲5八金△5二金
▲4六歩△3五角▲2七飛△4六角▲9五角△5七角成
▲同銀右△同飛成▲1六歩△5八龍
まで40手で後手の勝ち
今回のバージョンから先手必勝定跡らしきものが3割位の確率で現れており、そろそろソフトの先手に勝てなくなりそうです。
まだソフトの先手に勝てるのが凄い!そして、先手必勝定跡らしきものにソフトが自ら到達しようとしているのも凄い!
逆に言うとソフトが先手必勝定跡を見つけると、同ソフト同士の対局は、後手番の勝率が0%にならないとおかしいわけですね。次に公開する予定のバージョンで、現状、後手勝率30%ぐらいあります。まだまだ精進が足りないですかね…。