前回記事の続報が入ってきました。
Apery、昨年の電王戦版から、WCSC25版でKPA(KPE?)次元下げを導入し、R100~R150ぐらい強くなっていたようです。
WCSC25版、通りで強いはずです。Aperyはまだここから強くして電王トーナメントに参戦するようです。十分、化物級です…。昨年のAWAKEに匹敵する強さだと思います。
ちなみに、やねうら王もBonanza型の3駒でKPA次元下げを導入したバージョンを用意してAperyのWCSC25版と対戦させてみたいところ、500局やってピッタリ互角になりました。このやねうら王は昨年の電王トーナメント版のやねうら王に7割程度勝ち越すようです。
ただ、やねうら王、今回はBonanza型3駒の評価関数は使いませんので、このバージョンはお蔵入りです。さようなら、昨年のやねうら王に7割勝つやねうら王…。
やねうら王は、Bonanza型の3駒でやっていてもPonanzaは疎か、最新のAperyにも勝てる見込みが薄いので、今回は新しい評価関数で挑みます。(まだ完成してません&コード書けてません&強くなるかもわかりません。)
いよいよ俺様の6台(物理コア30、論理コア60)のPCで、やねんざメソッドを開始するぜ!! pic.twitter.com/wDrgz1hANT
— やねうら王 (@yaneuraou) November 13, 2015
そして今回は、最新版のAperyに匹敵するソフトとして(Ponanzaは別格として)nozomiとtanuki-がいます。
やねうら王は昨年のバージョンからR300~400は上げたいところ。あと1週間ありませんが、頑張ります!
twitterはやっていませんので、こちらで応援をば…
電王になれば+100万円(+新PC)ですよ!!新評価関数が良い結果になることを祈っています。
+150万円でした。訂正います(汗
アドレナリンだだもれ状態のやねさん。
PC代100万も払ったのですか!
これではもはや後には引けませんね。
新しい評価関数、どうか成功しますように、、、。
ぬこクラスター、ちゃんと動きますように、、、。
こんにちは。開発が終了した後で時間がとれた時にでも教えてください。
強さを測るためには、1000局対戦させるとします。(精度3%くらいでしょうか?)このとき、本番での持ち時間と同じ時間で行うのが理想ですが、時間がかかりすぎるために、持ち時間を短くすると思います。
このとき、強さが数値化できるとして、比較する思考ルーチンが、持時間にたいして同じ傾向を持っていないと適正な比較にならないのではないか、と思います。
たとえば、持ち時間の2乗に比例して強くなる思考ルーチンと持時間に比例している物があるとすると、持ち時間を変えての比較は無意味になりそうです。
この辺り、どの様に考えるべきでしょうか。類似のアルゴリズムであれば、同じ傾向を持つと考えるのでしょうか。
3点の位置関係を評価する物と、新やねうらメソッドはどうでしょう。
AとA’ を B を基準に比較する事はできそうですが、AとBの比較は難しい様に思います。
さらなる、HWトラブルが起きない事を、お祈り申し上げます。
では、では。
相対評価はできそうですが、絶対評価
> 比較する思考ルーチンが、持時間にたいして同じ傾向を持っていないと
この議論は、昔からよくあり、悩ましいところですね。
経験的に、同じ評価関数の形(ex.三駒関係)のソフトであれば、短い時間でも長い時間でも勝率それほど違わないですが。厳密に調べたことはないです。(長い持ち時間で何千局も出来ませんし…。)
早速のコメント有難うございます。
今、囲碁のプログラムを強くしようとがんばっているのですが、まったく強くなりません。
ベンチマークに、4石置いた状態から300局で比較しているのですが、一晩では終わりません。
以前は、思考量3倍で、100局だったのですが、対局数を増やすために変えました。
ただ、思考量を増やすと悪手も増える筈で、そのような状態でベンチマークをやっても意味があるのか悩んでいます。
明確な悪手を打たなくなるまで、思考量を減らしたベンチマークは良くない気がしてきました。
では、では。