将棋電王トーナメントの出場ソフトが発表になりました

投稿日時: 2016年9月8日投稿者: やねうらお

今年の将棋電王トーナメントの出場ソフトが発表になりました。
http://denou.jp/tournament2016/soft.html

やねうら王ライブラリ使用ソフト(学習部だけを使用なども含め)

・SilverBullet
・Squirrel
・shogi686
・Qhapaq
・うさぴょん2′
・Novice
・†白美神†
・たこっと
・読み太
・大将軍

真やねうら王も含めると、11ソフトですね。
大将軍が入っているのに一番、驚きました。

ハクビシンはたぬきっぽい姿の動物で、民家のやねうらに住み着く習性があるそうです。今回たぬきチームはライブラリにやねうら王を使っているため、この名前を選びました。なお†白美神†は当て字で、本来の漢字表記は白鼻芯または白鼻心です。

— nodchip@tanuki- (@nodchip) September 7, 2016

https://twitter.com/daruma3940/status/773479763197386753

とりあえず、大将軍がやねうら王ライブラリになったのが最大のニュースか?

— dasapon (@dasapon17) September 7, 2016

肝心の私のほうですが、私は環境が変わるとあまり寝れず、それが3日も続くと(生物学的に)死にかねないので、そろそろ体力的に参加が厳しくなってきました。電王トーナメントへの参加は今年で最後にするかも、です。

名人コブラもやねうら王を利用させていただいております。PR文書にははっきり書いておらず、申し訳ございません(>_<)

— 名人コブラ (@meijincobra) September 8, 2016

名人コブラもやねうら王を使っているとのことです。ありがとうございます。

「将棋電王トーナメントの出場ソフトが発表になりました」への15件のフィードバック

がうる 2016年9月8日 09:26 より:

ＰＲ文書見ました。がんばってください。

文書の中で角交換型4八金戦法を好んで指すのがponanza化の棋風とありましたが、ちょっと意味が分からなかったです。
昔から存在する型で、消極的な戦型ゆえにプロの間では流行らなかったし、簡単に悪形に出来る手筋があるのでとても最新の学習結果だと思えません。
Apery新評価関数や技巧に使っても簡単にハマるので、回避手筋が発見された訳でもなさそうですよ。
若手プロが最近使っているのを見ますが、ベテラン棋士に鼻で笑われているんじゃないでしょうか。

返信 ↓
- やねうらお 2016年9月8日 09:52 より:
  
  > とても最新の学習結果だと思えません。
  
  いまのTD(強化学習)の目標設定は、浅い探索の評価値が深い探索の評価値に近づけることです。少ない探索量で従来の探索量の結果と同じものが得るのがその狙いです。その結果、いままでは指さなかったような戦法(戦型)を指して、それがハマり形だったとしても、まあ仕方ないかなと…。
  
  返信 ↓
  - ひまわり＠山本 2016年9月8日 14:27 より:
    
    大した問題では無いのですが、浅い探索の評価値と深い探索の評価値を近づける学習はTDというよりはRootStrapですね。。。
    （TDもやられていたら申し訳ないですが）
    
    以下のURLの図がとても分かりやすいですよ
    https://chessprogramming.wikispaces.com/Meep
    
    返信 ↓
    - やねうらお 2016年9月8日 14:47 より:
      
      TDLeafの亜種かと思ってたんですけど、RootStrapがまさにそれなんですね。なるほど…。
      
      返信 ↓
masa 2016年9月8日 11:10 より:

”真やねうら王” の真は、”カタカナ・”の方が受けそうな気がしました。

返信 ↓
- やねうらお 2016年9月8日 14:03 より:
  
  「真」は、「シン・ゴジラ」のほうからではなく、FF14からなのです。
  
  返信 ↓
Yakitori 2016年9月8日 23:47 より:

今年もやってきましたね。この大舞台が。
何もできることはないので陰ながら機微を見つめたいと思います。
応援してマース。

返信 ↓
- やねうらお 2016年9月9日 06:09 より:
  
  時間とれなくて開発が進まないです。モチベーションもガンガン下がっていきます。(´ω｀)
  
  返信 ↓
BigHopeClasic 2016年9月9日 00:44 より:

電王トーナメントのルールを読みなおしたのですが、
「電王トーナメントの会場に開発代表者がいなければならない」とも「開発代表者が会場に代理人を派遣することを禁止する」とも書いていないのですよ。

あまり露骨なことをしてもなんですから、最初から代理人を決めておいてソフト開発者を連名で申請しておいて、やねさんは地元で高楊枝を決め込んでいても何の問題もないのではないかと。

もちろん毎年対局直前までいろいろとアジャストやチューニングを仕込んでおられるのは存じてますが、それ、やねさんが自分でやらないとダメな作業なんでしょうか。相手が決まったあとで電話やメールで指示するのではダメなんでしょうか。

返信 ↓
- やねうらお 2016年9月9日 06:07 より:
  
  第一回電王トーナメントの1日目に、Bonanzaの保木さんが学会か何かで参加できなかったそうで、保木さんの知り合いである代理の方が操作されてました。開発者には名前を連ねてない方の代理操作だったので、運営に許可をもらえば代理操作は可能なのでしょう。
  
  返信 ↓
りちゃ 2016年9月9日 06:07 より:

世界最高峰を目指すことへの挑戦！
応援しています。

返信 ↓
- やねうらお 2016年9月9日 06:11 より:
  
  応援、ありがとうございます。いまのところ、これといった成果が…出てませんが..。
  
  返信 ↓
  - りちゃ 2016年9月11日 13:44 より:
    
    ニコ動の「第4回将棋電王トーナメント、出場ソフト発表！」見ました。やねうら王は「本気になった浪速のトリックスター」と紹介されてますね。
    
    トリックスターって何だろうってwikipediaで見てみると「秩序を破り、物語を引っかき回すいたずら好き」「時には悪意を持って行動するが、結局は良い結果になることが多い」
    
    なかなか面白い表現です。
    
    返信 ↓
がうる 2016年9月9日 07:06 より:

評価関数の限界。その先へ。

やねうら王はMultiPV５にすると隙が無いですね。
ＳＭ＋新評価が４コア１８０秒くらいでやっと当たりを引ける複雑な局面でも、やねうら王をMultiPV５にすると５秒で当たりが入ってる。（探査が浅いので評価はまだ固まって無いが）
スロースターターの気質があるので短い時間だと中盤以降読み抜けは無いが読み負けている。
スタートダッシュを決めて、優位を譲らない展開になると強い。

評価関数が正確になるにつれて見えてくる物もありまして。
お互いが正確な評価を持っていて、同一定跡を使うと拮抗局面になりやすい。（要は相手のミス待ち）
この状態だと技巧がデタラメに強い。
拮抗局面でつばぜりあいの様に歩を２枚手持ちにして、３枚目の激突が起こった状態とかからは凄まじい。
ＳＭ＋新評価は自分が＋１００とかの状態から、技巧の攻撃をまったく予想出来ておらず、歩の連打から悪形コンボをくらって６００くらい傾けられる。

評価関数の限界が近いと言われている状況から先へ行くには、手筋的な概念を取り込まないとダメなんじゃないでしょうか。

返信 ↓
- やねうらお 2016年9月11日 19:20 より:
  
  > 評価関数の限界が近いと言われている状況から先へ行くには、手筋的な概念を取り込まないとダメなんじゃないでしょうか。
  
  LMRが手筋的な何かに相当するような気がしなくはないですが、うまくすればLMRを超えられるのかも知れませんね…。(私はそこまでやる余力がないですが)
  
  返信 ↓

やねうら王公式サイト

コンピューター将棋やねうら王公式サイト

将棋電王トーナメントの出場ソフトが発表になりました

「将棋電王トーナメントの出場ソフトが発表になりました」への15件のフィードバック

コメントを残すコメントをキャンセル

「将棋電王トーナメントの出場ソフトが発表になりました」への15件のフィードバック

コメントを残す コメントをキャンセル

コメントを残すコメントをキャンセル