今日も実況していきます。
やねうら王ライブラリ使用チーム
当初13チームかと思っていたのですが、PR文書に書いてないけど使っているよと教えていただいたチームが何チームかあり、また会場で、「学習部参考にさせていただいてます」と言っていただけたチームも何チームかあったので、2/3近くのチームがやねうら王を何らか参考にしているようです。バグ報告もいただけたりして助かります。
やねうら王の学習部で雑巾が絞りにくかった理由
理由がある程度わかったので、気が向いたら書きます。
真やねうら王、強くなったよ?
とりあえず、なんやかんやして今日のやねうら王は昨日のやねうら王からR40程度上がりました。これで浮かむ瀬は超えた…はず。それでもponanzaとはR200程度の差がある計算になりますが。まあ、R200差ならponanzaと当たれば2割強ぐらいの確率で一発入るかもということで。
本戦の組み合わせ
将棋電王トーナメント、明日の組み合わせ決定 pic.twitter.com/WuOn5knuBc
— math26 (@math26) October 8, 2016
にこあ将棋
にこあ将棋作者「モンテカルロ探索を使っているんですが、全然強くならなくて。やねさんは以前、モンテカルロ将棋を作っておられたんですよね?」
やね「私もR2300ちょっとぐらいにしかならなかったですね。将棋にモンテカルロは合わないんじゃないですかねー。将棋は一直線の変化で悪くなるケースとかが多々あるので、モンテカルロ向きではないんでしょうね。それでも、指し手を(激指の)実現確率で選ぶだとか、(技巧がやっているように)多クラスロジスティック回帰で選ぶかすれば、シミュレーションの質は上がるので従来のものよりは強くなると思いますけども。」
†白美神† vs Qhapaq
電王トーナメントのルール上、定跡は思考部ではないらしく、思考部にしか独自性(?)は求められていないようなので、†白美神†のtanuki-さんに、真やねうら定跡のDBファイルを渡して使ってもらうことに。
†白美神†の初手38銀が炸裂します。
†白美神†がそのあと指しこなせるかどうかは知りませんが、Qhapaqはやねうら大定跡を用いているようで、定跡DBにはhitしないので持ち時間上、かなりのアドバンテージが得られるでしょう。
うさぴょん2′ vs 真やねうら王
うさぴょん2’の4手目の32金(舟囲いを拒否する指し手)に対して、やねうら王は飛車を四間に振って、立石流を目指す真やねうら王定跡通りの進行。(昨日のやねうら王 vs なのはと同じような進行)
うさぴょん側は、序盤の持ち時間を結構使う設定らしく(2時間の持ち時間に対する調整が不十分とのこと)、長い駒組みになるであろうこの戦型においてはずいぶん損をする可能性も。やねうら王側も序盤にかなり時間を使う設定なので、これはお互い時間のない終盤に突入すること必至かも。やねうら王側として嫌な展開に。
形勢がほぼ互角のまま泥沼のような終盤に突入し、うさぴょん側に緩手が出て一気にやねうら王側の勝ちが決まったようです。
会場の様子
将棋電王トーナメントがハロウィン状態です(☆_☆)#shogi #電王トーナメント pic.twitter.com/3HsMlJh6lW
— sumomo (@aski0601) October 9, 2016
ponanzaの山本君からお褒めの言葉
山本「やねうら王のソース見ました!更新もこまめだし、ソースコードには解説がたくさんついていて読みやすいですね!」
やね「ありがとうございます」
山本「ただ、(探索部の)独自性があまり…」
やね「その点については、申し訳ありません!」
たこっと vs 真やねうら王
たこっとは予選では時間切れ負けをしたソフトです。持ち時間を消費して秒読みに入る段階で、秒読みに入る前にponderが絡むと時間の計算を間違えて切れ負けするバグがあったのだそうです。
そんなバグを抱えて1敗を喫して、そのあと勝ち残ったという意味では実力派のソフト。
今回は2時間切れ負けなのですが、朝の段階では何故か1手1秒で指すバグがあったようです。たこっとはシード枠だったので、その間にデバッグしてことなきを得ましたが、定跡の入力まで間に合わず、初手から定跡なしで思考をしています。
やねうら王側の飛車が詰みそうだったのですが、飛車切り〜角切りの大技が決まって形勢を決しました。39銀の割打ち(飛車が寄れず無条件に金を取られる)の指し手がたこっとは読み抜けていたようです。
真やねうら王がたこっとに勝利して、準々決勝に駒を進めました!
大将軍の評価関数の件
やね「今回は4駒(KKPP)はされてないんですか?」
横内さん「学習が間に合わない(次元数が多いなどの理由により)ので、今回はやってないですね」
やね「では今回はKPPTですか?」
横内さん「KKPのほうしか手番は入れてないです」
やね「KPPTはしないにしてもPPT(2駒+手番)はやったほうがいいのでは。駒の当たりが見れますし」
横内さん「あー。そうですね」
やね「まあ、静止探索の書き方によってはPPTも要らないかも知れませんけども…わかりません><」
ponanzaのKSPってなんですか?
やね「なんとかちゃんねるに書いてあった、ponanzaのKSPのSってなんなの?」
山本君「なんすか、KSPって?」
やね「Ponaxにそういうファイルが入ってたということで、そのSが何であるか噂になってたので」
山本君「ああ、あれはSliderのS」
やね「S = 飛車、角、香?KPPに含まれてるのとはどう違うの?」
出村さん「NDF式に、飛び利きが届いているときのみのPでは」
やね「ああ、そのときにボーナスを加算するのか」
山本君「うん。ちなみに、そのファイル使ってないんだけど(笑) (当時)使ったり、使わなかったりしてた」
結果
ponanza、真やねうら王、浮かむ瀬、読み太がベスト4確定。
この4ソフトによって明日、準決勝、決勝、4位決定戦が行われます。
真やねうら王も残っています!明日もこのブログで実況していきます。開発者に質問があればコメント欄に書いておいていただければと。
私のほうは、今日は他の開発者と話していてブログを更新する時間があまりなかったです。ごめんなさい。
昨日は技巧のファンが予想以上に多い印象でしたね。
やはり公開しているソフトの強みですね。
大将軍の開発者がちょうどラスト前にインタビューで「5ヶ月前の世界コンピュータ将棋選手権では3位だったが(ラストが技巧なので)今日で終わり」みたいなこと言ってて、同情票が集まっているような雰囲気の中で技巧に勝利。
なぜか白美神に負けたのが悪いみたいなとばっちりにはちょっと笑いました。
やねうらファミリーの刺客達がApery(浮かむ瀬)ブロックに固まってしまいましたね。
正直Ponanzaと真やねうら王にはR100程度の差しか無かったと思います。
(よくある戦型からは将棋ウォーズのフィードバックがあるのでもちょっと分が悪いかも)
うさぴょん2+たこっとに連勝は60%~70%くらいかもしれませんが、勝ち抜いてPonanzaを沈めてほしいです。
応援しています。
サッカーの日本代表を応援する気分ですね。
日本代表の健闘を祈りつつ、スペインやブラジルには、日本をボコボコにしてサッカーの奥深さ、日本代表はまだまだこれからだという部分を見せつけてほしいという矛盾した気分。
全然更新されないけど、ネタはないんすか?
ネタはありまぁす!
今更ながら小保方さん、って。
芸が細かいですねwww
3八歩が癌ですねぇ。
コレ使えたら早いけど。
ただどっちも堅いので時間で終盤行けそうですね。
相手の攻めが細い中で玉が広くなったので行けましたね。
来年から、参加資格に 「被り物を用意する事」とか、ありそう。
開発者の間で、被り物が流行るかも知れませんね。
屋根裏の王といえばネズミでしょうか。
映画の最大手にも、ゲームの最大手にもいるのでとても楽しみです。
>開発者の間で、被り物が流行るかも知れませんね。
明日のポナンザ戦の被り物が楽しみだなぁ
私は被りませんよ?
大将軍は結構前から4駒の評価関数に着手したり、評価関数には一家言ありそうな印象です。
Apery(浮かむ瀬)とかに比べ、ピーキーな仕上がりになってそうなので面白そうです。
インタビューで公開する程ではないと言ってたので、公開するように言って下さいよ。
4駒と言ってもKKPPなのでそれは単にKPP + KPPを合成しているのに近いような。とりあえず、インタビューしてきました!本文に書きました。
大将軍の開発者さん=横内さん
アーカイブとしては文字列置換しておいた方がよいかと。
はい(`・ω・´)ゞ
準決勝進出おめでとうございます。流石ですね
次は歩なんざの可能性が高そうですが、是非がんばって下さい
頑張ります(やねうら王が)
正直、さくらのサーバー力で棋力盛ってるポナがやねうら王DISってんのどうかなと思います。
機械学習に使えるリソースが参加者毎に差があるのってなんか不公平な感じがして。
本来、将棋プログラム同士が戦うならアルゴリズムとか最適化で勝負するべきだとおもうのですが、やねさん的にはどう考えていますか?
ponanzaの探索技術はそれだけでも群を抜いてますよ。彼らがStockfishチームに入れば、StockfishのレーティングをすぐにR200以上あげると思います。さくらサーバーが使えなかろうが、彼らの独走は揺るがないでしょう。
将棋ソフトの探索部で、チェスソフトの探索部にフィードバックできる要素とか多いんでしょうか?
たくさんありますね…。私もいまのStockfish、R50ぐらいならすぐに上げられる自信があります。
なんとかチャンネルとかなんとか名人のコメント欄とかに居る日本のコンピュータ将棋開発者なんてStockfishをパクってるだけで何の貢献もしていないって書き込み見ますけど、平岡さんがこの前バグの指摘だったかしていましたし、読み太の開発者の方も開発していたときにバグ報告とかしていたとかやねさんが仰っていましたっけ。
Stockfishを参考にしている開発者の皆さんはバグ報告とか修正提案とか結構やられているものなのでしょうか?
日本人の美徳でわざわざ公言とかしていなかったり、匿名でやってたりとかなのでしょうか?
まぁ、そんな批判を気にする開発者の方は居ないのかもしれませんが、彼らを黙らせるには良いかも。
開発者の方々を貶す書き込みは見ていて気分は良くないので。
やねさんが提案なりバグ報告なりしてその結果をこのブログで記事にしてソース(コードのソースじゃなくて出典元)化すると良いかも。
そしたら、今度はStockfishはワシが育てたとホラを吹いているって嘘を書き込む輩が出てきますかねw
Stockfishのバグに気づくことは多々ありますが(やねうら王では10箇所ぐらい修正して使ってました)、大抵はすぐに直るので私は特にpull requestすることはないですね…。Stockfish自体の探索の改良も出来なくはないですが、何万回と自己対戦などを経由しないといけないのでもっと大掛かりな話になってきます。
なるほど、提案するにしても意味があるものをしようと思えば将棋ソフトの開発と同じくらいのリソースを割かないといけなくなってしまうのですね。それでは本末転倒で意味がないですね。
準決勝進出おめでとうございます。
賞金確定ですね!
後はPonanzaを倒すのを楽しみにしておきます。
(ponanzaに負けたあとの)3位決定戦で勝てるかどうかをいま考えています…(´ω`)
3日目残留おめでとうございます。
千田先生も仰っていた魔女1.2ですが、対局数こそ少ないものの以前より6-7割の勝率では?ともいわれています。
やねうら ”王”による魔女を巡る冒険はまだ続くのでしょうか?
魔女1.2ってStockfishの最新のコード取り入れただけなので、やねうら王2016Lateのほうがそれより強いです。
大会が終わってからでいいので、よかったらオープンソース化による効果などの感想を書いてもらえないでしょうか。非常に興味があります。
オープンソース化によって、真やねうら王の開発がはかどった、バグ修正に大きな効果があった、おもしろいけど実は開発進捗には貢献しなかった、などです。
(`・ω・´)ゞ
直前に大改造したという記事をみた時はどうなることかと思いましたが、決勝進出おめでとうございます。
探索は、まだまだ改良できるんですね。もしもPonanzaが羽生さんに勝ったら、ソース公開する予定は無いのか聞いてほしいです。
毎度の残留力で4位確定。
素晴らしいです。おめでとうございます。
トリックスターとして一撃入れてほしい所存です。
リーグ常連名乗っても問題ないレベルには成熟したんじゃないかと思いますね。
素晴らしいです。おめでとうございます。
でも、まだ上がありますよ。
> 山本「やねうら王のソース見ました!更新もこまめだし、ソースコードには解説がたくさんついていて読みやすいですね!」
> やね「ありがとうございます」
> 山本「ただ、(探索部の)独自性があまり…」
■進行度合いの駒割が現状とミスマッチ
序盤~終盤にかけて常に同じ駒価値はちょっと変かなと思った。
■今後の開発で進行度による駒割調整を導入するとかなりバランスが良くなりそうだと思いました。
予選、決勝Tの棋譜で気になった点。
①Apery(浮かむ瀬)戦での▲8二歩打。駒が安い歩と角と馬の差から悪手を選択した。
中盤初期においては、歩損であっても厳し目のマイナスを付けたほうがバランスが良くなる気がした。
②Ponanza戦もチラッと再生されてたので見ました。
やねうら王の駒割がどう設定されているか分かりませんが、
谷川浩司著「将棋に勝つ考え方」で桂馬=6点、成桂=10点、角=13点、飛車=15点となっていますので、
55桂打からの飛車角交換+成桂の悪手を選択してしまい、勝ち将棋を逃してしまったのではないかと思いました。
③うさぴょん2′戦
18手目の端歩突き越しが早すぎる。先手番ではこれでいいが、後手番だとこの1手で悪くなる場合がある。今回の場合は50手目の8一飛がこの1手分で9二香と出来ていなかったので、9一飛からのカウンターが出来ずに防戦一方になった。これは手数の差で相手の銀が間に合ってしまったのが原因で、44手目の3一飛で角交換を誘うしか上手い受けが無いと判断したからです。
この流れはソフトにはまだ難しいのでどうしようも無いのですが、問題はここでソフトは2二角打の流れから2八角打の即死ルートを深く読んでしまうことです。
私の勘ですが、これは香車の駒価値が安いことがトリガーになり、2二角打を簡単に許してしまうんだと思います。もちろんいろいろな要因が絡むんですが最終的には悪いことに気づき、本譜のように2七角打から3八歩打とします。
3二金型の場合、大きなテーマのひとつとして、駒をさばいて相手の大駒が入って来たときに3一歩打とかでシャットアウトする狙いがありますが、これが出来ずに当分使えない浮いた歩を抱えることになります。
そして取られた香車の攻めから負けるのを何度も見たことがあります。
> 序盤~終盤にかけて常に同じ駒価値はちょっと変かなと思った。
KPPでも駒の盤上の位置評価が終盤に出現する特徴ほど高くなるので、相対的に駒の価値が終盤で減っているのと同じですね。
うーむ、持ち駒の桂馬や金は、終盤に価値が高くなりそうですが。
敵陣に打つ手前ということで、2手先の探索で評価はされるんでしょうけど。
個々のブログに書くべきかは分かりませんが
やはり千田先生のようなコンピューター将棋を知っている人の解説やインタビューは適切に踏み込みつつ分かりやすく喋ってくれるので、二日目はとても楽しかったです。
二日目ハイライト
・どこにでも現れるやねうらお
・103の妖精感
・6h_human(チタンザ)
・やっぱり強いponanza
解除では放送が聞こえないのでタイムシフト見直さなきゃ(´ω`)