やねうら王系の最強ソフト、読み太

投稿日時: 2016年4月6日投稿者: やねうらお

今回は、WCSC26(世界コンピューター将棋選手権)の出場ソフトのうち、やねうら王を使用ライブラリとして採用しているソフトのうち、おそらく最強であろう、読み太のことについて書きます。

私が、やねうら王classicを持ち時間制御に対応させたのがつい先日。もう少し調整したら、やねうら王classic-tce(time control enabled)版として正式公開しようと思っています。

このclassic-tce版をHaswell 6コアのPCでfloodgateに投入したところR3140～R3190程度。強いソフトにたまたま勝った直後はレーティングが少し高めに出るわけですが、いまのところ平均的にはR3160ぐらいだと思います。

これに対して、読み太は、R3400を記録しています。やねうら王classicと同じ評価関数を使っているはずなのに…。用いている評価関数が全く同じであることは、評価値グラフからも明らかです。

読み太のPCのスペックはわかりませんが、16コアとかでないとしたら、探索部の差だということで、かなり負けている感じがします。同じようにStockfish7をベースとしていて、私のほうも、かなり慎重に探索のハイパーパラメーターのチューニングをしているのに、こんなに負けるとは驚きです。

逆に同じ評価関数を使っているから直接対決のときにわずかなハイパーパラメーターの差が利いてくるというのはあると思いますが、読み太はApery系にも堅実に勝利していて、やねうら王系にだけ強いというわけでもなさそうです。

プロ棋士に将棋ソフトが圧倒的に勝利しはじめた昨今、コンピューター将棋は興行としてオワコンだと言う人がいるなか、機械学習の興隆や、Apery・やねうら王などの上位ソフトのオープンソース化により、凄い人が次々と登場するコンピューター将棋界隈、まだまだ賑やかになりそうですね。

「やねうら王系の最強ソフト、読み太」への26件のフィードバック

匿名 2016年4月6日 07:20 より:

探索部の調整だけでR3400は不可能じゃありませんか？

やねうら評価関数のままで探索部を調整しようが、ハイスペックPCを使おうが
R3200あたりが限界に思えます。

なにか隠された秘術でもあるんですかねぇ

返信 ↓
- やねうらお 2016年4月6日 08:13 より:
  
  Aperyが6コア→24コアPCで+R200ぐらい上がるのは間違いないので、それぐらいのスペックのPCなら、やねうら王classic-tceでもR3400は出るはずです…。
  
  返信 ↓
- やねうらお 2016年4月7日 10:15 より:
  
  とりあえず、最新版のclassic-tceを
  floodgateに投入してますが、どうもR3300は超えてそうです。(いまR3350ですが対局数が少ないのでまだ何とも…)
  
  まだ探索部は改良の余地が大いにあるので、いまのままの評価関数でもR3400ぐらいまでは頑張ればいくと思いますよ。
  
  返信 ↓
  - woodyring 2016年4月14日 23:16 より:
    
    結構前から気になっているのですが、depthの３乗ボーナスがやり過ぎということはないでしょうか？Stockfishと同じ２乗ボーナスにすると５％ぐらい勝率があがる気がします。あくまで短時間の話なので長時間だと別かもしれませんが・・・
    
    返信 ↓
    - やねうらお 2016年4月15日 01:00 より:
      
      うおー！！！Stockfishのコード、普通に勘違いして3乗に見えてました。修正したところ、1.4%ほど勝率が上がりました。357-79-337(R10.0) ありがとうございます。
      
      返信 ↓
ポイド 2016年4月6日 09:59 より:

floodgateに投入されたやねうら王classic-tceは去年の電王戦トーナメントに出場したやねうら王と比較した場合どれくらいのR差があるのですか？

返信 ↓
- やねうらお 2016年4月6日 10:39 より:
  
  去年の電王トーナメント版のやねうら王より強いはずです。去年のやねうら王1手0.1秒で思考させられないので(そういうコード書いていない)、直接的な比較はしていないですが…。あと、今回使ってる定跡は選定していないのでそのへんでちょっと損している可能性はあります。
  
  返信 ↓
ジャック 2016年4月6日 20:47 より:

読み太の作者の方の名前で
検索したら奨励会１級の所に同じ名前がありました。
同一人物ですかねえ。

返信 ↓
りちゃぼう 2016年4月6日 23:41 より:

floodgateに常駐させ、定跡を作るための棋譜を集めています。と言っているからおそらくCorei7 6700HQじゃないのかなぁ。

とにかくすごいなぁ

返信 ↓
- やねうらお 2016年4月7日 08:16 より:
  
  floodgateに参加させているPCは、ご本人いわく、Corei 7 5820K 6coreだそうです。やねうら王classic-tceのほうもR3300ぐらいまでは伸ばせる見込みが立ってきたのでしばしお待ちを..
  
  返信 ↓
odagaki0621 2016年4月7日 01:18 より:

やねうら王classic-tce付属の定跡ファイルは不必要
だと思います。初手から定跡にない手をやたら指す
ので定跡ファイルを削除してみましたら初手に２０秒ほど思考しますが後は特別長考せず、ほぼ定跡に近い手を指すようになりました。試しに削除しないバージョンと１０分切れ秒読み１０秒で２０戦させましたら削除したバージョンが１２勝８敗で勝ち越しました。思考時間も少し短くなったようです。

返信 ↓
- Yakitori 2016年4月7日 02:33 より:
  
  面白いですね。ひようら王問題ですかね。
  ヘタな定跡なら載せないほうがマシっていう。
  やねうら王の伸びしろにも期待です。
  
  返信 ↓
  - Yakitori 2016年4月7日 02:35 より:
    
    棋譜自作したのはひまうら王か。失礼しました。
    
    返信 ↓
- やねうらお 2016年4月7日 08:07 より:
  
  定跡入れておかないと同じような局面に行って、勝率が偏るので、散らすために入れています。
  
  NarrowBookのオプションを有効にすると確率の低い指し手は選ばないのでそこまで悪い進行にはならないと思いますよ。あとは定跡の指し手の手数をMaxBookMoveオプションで設定できるので、16手ぐらいに制限してみては。
  
  それから、自己対戦は、20局では少なすぎて参考にはならないです。(私は何かパラメーターを変えるごとに500〜3000局ぐらいやってます)
  
  返信 ↓
- samurai 2016年4月8日 15:26 より:
  
  ２０戦の対戦では１％有意水準が１６勝、５％が１４勝ですね。
  １２勝では１２％の確率で偶然でも起こりえます。
  
  スクリーニング水準としては５％は確保したい所。
  従って、２０戦の場合は１４勝以上でないと、その提案は弱いかと。
  
  ちなみに３０戦の場合は１％有意水準が２１～２２勝、５％が１９勝あたりです。
  
  返信 ↓
  - やねうらお 2016年4月12日 16:01 より:
    
    まあ、やねうら王classic-tceの使っている定跡が質が大変悪くてこれを使うと勝率が下がるという点については別に異存はないのですけど、もう少し対局数は見て欲しいと思っただけでして。
    
    返信 ↓
- samurai 2016年4月9日 01:16 より:
  
  ３０対局の計算が違っていましたので訂正します。
  １％有意水準が２２勝以上、５％が２０勝以上です。
  
  ちなみに以下５０局、１００局、５００局の場合ですが、、、
  ５０局
  １％有意水準が３４勝以上、５％が３１勝以上。
  １００局
  １％有意水準が５９勝以上、５％が５７勝以上。
  ５００局
  １％有意水準が２７７勝以上、５％が２６９勝以上。
  
  以上のように、対局数を増やせばそれだけ検出力が上がる、、、ということであります。
  
  返信 ↓
  - samurai 2016年4月9日 01:25 より:
    
    １００局、タイプミスしました。
    １００局の正解は、、、
    １％有意水準が６２勝以上、５％が５９勝以上。
    
    返信 ↓
  - samurai 2016年4月10日 05:59 より:
    
    ちなみに１０００局の場合
    １％有意水準が５３７勝以上、５％が５２７勝以上でした。
    
    返信 ↓
- samurai 2016年4月23日 12:24 より:
  
  https://twitter.com/yaneuraou/status/723702153789874177/photo/1?ref_src=twsrc%5Etfw
  
  なるほど、なかなか有効な因子は出てこないものなのですね。
  そうしてこの状況、なにやらビットコインの採掘現場を見ているような印象でもあります。
  
  返信 ↓
samurai 2016年4月28日 11:35 より:

https://twitter.com/yaneuraou/status/725327594892095489?ref_src=twsrc%5Etfw

さて、この話の落ちはどうなったのか？
友達は希望がかなったのか？それともかなわなかったのか？

気になるところであります。

返信 ↓
- やねうらお 2016年4月28日 17:46 より:
  
  「お金を貸した」→ 「友達にでもお金なんて貸すものではないよ」という批判および、「やねさんお金貸してくれるのか。俺も頼もう。」という便乗。
  「お金を貸していない」 → 「やねさんってお金もってるはずなのに友達にもお金貸さないだなんて案外ケチなのね」という批判。
  
  どっちに転んでも批判は免れないから、そういう部分はあえて書かないのだ…。
  
  返信 ↓
- samurai 2016年4月29日 10:55 より:
  
  借り手の方は、まずもって希望額が楽に融通できそうな、そして頼みやすい人に頼むのが合理的でありましょう。
  
  一方頼まれた方は、「友達とはお金の貸し借りはしない。」という信条をお持ちの方を除けば、そのたびごとに判断をしなくては、悩まなくてはいけません。
  そこには「必ず断らねばならない理由」もなければ「必ず貸さねばならない理由」もないからであります。
  そうして、「物の貸し借り」に比較してなぜだか友達との間の「お金の貸し借り」には抵抗感があるのであります。
  
  つまるところ、友達関係にお金の貸し借りが入り込むと、どうしてもそれまでの友達関係が変化してしまう、違うものになってしまいそうなのが、いやなのでありますね。
  
  返信 ↓
samurai 2016年5月1日 12:04 より:

https://twitter.com/yaneuraou/status/726387798769434625?ref_src=twsrc%5Etfw

やっぱり時代はグーグルさんを筆頭にして「大量の学習過程をクラスター化する」という第二次クラスター戦争の時代に突入していくのでありました。
ちなみに第一次クラスター戦争は、（これも現在進行形ではありますが、）GPS（６７０）やプエラαのような実戦時の能力向上の為のものであります。

返信 ↓
- samurai 2016年5月2日 13:00 より:
  
  https://twitter.com/yaneuraou/status/726381215406645248?ref_src=twsrc%5Etfw
  
  将棋AIもプログラムして、教師あり学習を一回させれば（パラメータが収束すれば）それで完成、、、という時代は終わった様であります。
  今後はプログラムしたAIをどうやって強いものに育て上げるのか、、、ということまでを含めた、総合戦略の時代に入っていくのでありました。
  
  返信 ↓
- samurai 2016年5月3日 11:55 より:
  
  https://twitter.com/yaneuraou/status/725657726659878912?ref_src=twsrc%5Etfw
  
  プログラムするという行為は明示的ではあるが、学習によって育て上げるという行為はそれほど明示的ではない。
  それゆえに親の期待通りに育たないのは、人間でもAIでも同じように起きるものと思われる。
  
  追伸
  選手権、うさ親さんもきふわらべさんも活躍しておられ、なによりであります。
  平岡さんも初日からご出勤のようで、お疲れ様であります。
  
  返信 ↓

やねうら王公式サイト

コンピューター将棋やねうら王公式サイト

やねうら王系の最強ソフト、読み太

「やねうら王系の最強ソフト、読み太」への26件のフィードバック

コメントを残すコメントをキャンセル

「やねうら王系の最強ソフト、読み太」への26件のフィードバック

コメントを残す コメントをキャンセル

コメントを残すコメントをキャンセル