今年の将棋電王トーナメントの出場ソフトが発表になりました。
http://denou.jp/tournament2016/soft.html
やねうら王ライブラリ使用ソフト(学習部だけを使用なども含め)
・SilverBullet
・Squirrel
・shogi686
・Qhapaq
・うさぴょん2′
・Novice
・†白美神†
・たこっと
・読み太
・大将軍
真やねうら王も含めると、11ソフトですね。
大将軍が入っているのに一番、驚きました。
ハクビシンはたぬきっぽい姿の動物で、民家のやねうらに住み着く習性があるそうです。今回たぬきチームはライブラリにやねうら王を使っているため、この名前を選びました。なお†白美神†は当て字で、本来の漢字表記は白鼻芯または白鼻心です。
— nodchip@tanuki- (@nodchip) September 7, 2016
自分もやねうら王ライブラリを使うにあたってSquirrel(リス)というソフト名を屋根裏に住んでるリスのような生き物であるNezumi(ねずみ)にしようかと思ったけどNozomiと紛らわしいのでやめておいた(^_^;)
MouseやRatはダサいのでキャンセルだ。— だるま (@daruma3940) September 7, 2016
とりあえず、大将軍がやねうら王ライブラリになったのが最大のニュースか?
— dasapon (@dasapon17) September 7, 2016
肝心の私のほうですが、私は環境が変わるとあまり寝れず、それが3日も続くと(生物学的に)死にかねないので、そろそろ体力的に参加が厳しくなってきました。電王トーナメントへの参加は今年で最後にするかも、です。
@yaneuraou 名人コブラもやねうら王を利用させていただいております。PR文書にははっきり書いておらず、申し訳ございません(>_<)
— 名人コブラ (@meijincobra) September 8, 2016
名人コブラもやねうら王を使っているとのことです。ありがとうございます。
PR文書見ました。がんばってください。
文書の中で角交換型4八金戦法を好んで指すのがponanza化の棋風とありましたが、ちょっと意味が分からなかったです。
昔から存在する型で、消極的な戦型ゆえにプロの間では流行らなかったし、簡単に悪形に出来る手筋があるのでとても最新の学習結果だと思えません。
Apery新評価関数や技巧に使っても簡単にハマるので、回避手筋が発見された訳でもなさそうですよ。
若手プロが最近使っているのを見ますが、ベテラン棋士に鼻で笑われているんじゃないでしょうか。
> とても最新の学習結果だと思えません。
いまのTD(強化学習)の目標設定は、浅い探索の評価値が深い探索の評価値に近づけることです。少ない探索量で従来の探索量の結果と同じものが得るのがその狙いです。その結果、いままでは指さなかったような戦法(戦型)を指して、それがハマり形だったとしても、まあ仕方ないかなと…。
大した問題では無いのですが、浅い探索の評価値と深い探索の評価値を近づける学習はTDというよりはRootStrapですね。。。
(TDもやられていたら申し訳ないですが)
以下のURLの図がとても分かりやすいですよ
https://chessprogramming.wikispaces.com/Meep
TDLeafの亜種かと思ってたんですけど、RootStrapがまさにそれなんですね。なるほど…。
”真やねうら王” の真は、”カタカナ・”の方が受けそうな気がしました。
「真」は、「シン・ゴジラ」のほうからではなく、FF14からなのです。
今年もやってきましたね。この大舞台が。
何もできることはないので陰ながら機微を見つめたいと思います。
応援してマース。
時間とれなくて開発が進まないです。モチベーションもガンガン下がっていきます。(´ω`)
電王トーナメントのルールを読みなおしたのですが、
「電王トーナメントの会場に開発代表者がいなければならない」とも「開発代表者が会場に代理人を派遣することを禁止する」とも書いていないのですよ。
あまり露骨なことをしてもなんですから、最初から代理人を決めておいてソフト開発者を連名で申請しておいて、やねさんは地元で高楊枝を決め込んでいても何の問題もないのではないかと。
もちろん毎年対局直前までいろいろとアジャストやチューニングを仕込んでおられるのは存じてますが、それ、やねさんが自分でやらないとダメな作業なんでしょうか。相手が決まったあとで電話やメールで指示するのではダメなんでしょうか。
第一回電王トーナメントの1日目に、Bonanzaの保木さんが学会か何かで参加できなかったそうで、保木さんの知り合いである代理の方が操作されてました。開発者には名前を連ねてない方の代理操作だったので、運営に許可をもらえば代理操作は可能なのでしょう。
世界最高峰を目指すことへの挑戦!
応援しています。
応援、ありがとうございます。いまのところ、これといった成果が…出てませんが..。
ニコ動の「第4回将棋電王トーナメント、出場ソフト発表!」見ました。やねうら王は「本気になった浪速のトリックスター」と紹介されてますね。
トリックスターって何だろうってwikipediaで見てみると「秩序を破り、物語を引っかき回すいたずら好き」「時には悪意を持って行動するが、結局は良い結果になることが多い」
なかなか面白い表現です。
評価関数の限界。その先へ。
やねうら王はMultiPV5にすると隙が無いですね。
SM+新評価が4コア180秒くらいでやっと当たりを引ける複雑な局面でも、やねうら王をMultiPV5にすると5秒で当たりが入ってる。(探査が浅いので評価はまだ固まって無いが)
スロースターターの気質があるので短い時間だと中盤以降読み抜けは無いが読み負けている。
スタートダッシュを決めて、優位を譲らない展開になると強い。
評価関数が正確になるにつれて見えてくる物もありまして。
お互いが正確な評価を持っていて、同一定跡を使うと拮抗局面になりやすい。(要は相手のミス待ち)
この状態だと技巧がデタラメに強い。
拮抗局面でつばぜりあいの様に歩を2枚手持ちにして、3枚目の激突が起こった状態とかからは凄まじい。
SM+新評価は自分が+100とかの状態から、技巧の攻撃をまったく予想出来ておらず、歩の連打から悪形コンボをくらって600くらい傾けられる。
評価関数の限界が近いと言われている状況から先へ行くには、手筋的な概念を取り込まないとダメなんじゃないでしょうか。
> 評価関数の限界が近いと言われている状況から先へ行くには、手筋的な概念を取り込まないとダメなんじゃないでしょうか。
LMRが手筋的な何かに相当するような気がしなくはないですが、うまくすればLMRを超えられるのかも知れませんね…。(私はそこまでやる余力がないですが)