技巧と並ぶソフト(評価関数?)の出現により、オープンソースの将棋ソフト界隈も賑わって参りました。
現在、オープンソース最強のソフトはどれなのでしょうか?
以下のような相性問題があるか?(ないか?)というツイートがありました。
※ やねうら王と魔女の評価関数ファイルはApery20160815とします。
評価関数20160805では SM vs 技巧(260-8-231), やねvs技巧(265-9-226) SM vs やね(240-31-229)となり三者拮抗。相性問題は誤差の範囲ではないようだ。
— uuunuuun (@uuunuuun1) August 19, 2016
私の手元の実験では、魔女とやねうら王とで全く同じ評価関数ファイルを用いた場合、技巧を含めて三すくみのような傾向は見られます。
同じソフト同士の対局の場合、PV(最善応手列≒読み筋)で相手よりわずかに上回ると勝率が大差になります。
実際は同じ探索部、同じ評価関数(のファイル)ということはありえないのですが、上記の実験では、魔女とやねうら王とは同じ評価関数(Apery20160815)を用いているので、探索部が似ている、魔女とやねうら王とでは、このへんを過剰にやっている魔女のほうに軍配が上がるようです。
しかしこういうチューニングは他のソフトとの勝率はむしろ下がるので、このへん過剰なチューニングは私はしたくないのでしていないです。また、大会では全く同じ評価関数ということはありえないはずなので、ここは問題とならないはずです。
おそらく、同じぐらいの強さの別の評価関数(のファイル)を持ってきた場合は互角か、やねうら王のほうが勝ち越すと予想しています。(が、同じぐらいの強さの別の評価関数を用意するのが難しいので実験はしていないです。)
さて、さてさてさて。バランス問題のお時間でしょうか。なんて・・・。
こういうのがやっぱ多様性として面白いですね。
危惧していた、上昇曲線の問題もまだ大丈夫だそうですし、上澄みがまだあるというのは素晴らしいです。
やねうら王はいままで妙な勝負強さを出しているのでその上澄みで倒してしまいそうな期待があります。
はてさて。
3駒関係の表現の限界からくる頭打ちはじきに来るはずなんですけど、なかなか来ないですね…。探索のほうもノーフリーランチ定理みたいなのから来る限界が来るはずなんですけど、全然来ないですね。むしろフリーランチ、食べ放題で美味しいです、もぐもぐ状態ですね。
その一端は、ポナが羽生さんを倒すために上澄みを合成しているからかもしれません。
上があるとやる気になるもんだと思います。
ポナが羽生さん倒して止まったらソフト開発も滞るんじゃないかと心配です。
山本さんはどこまで開発を続ける気なのだろうか。囲碁に行ってしまうのか・・・。
ponanzaが居なくなって、Aperyの平岡さんが結婚して引退して、私も開発をやめてしまうと、将棋ソフトの進歩自体が停滞しかねないですね。なんと狭い世界なんでしょう…。
伝説になってしまいますねぇ。
レジェンドですよ、レジェンド。
遺産を引き継ぐホープの登場に期待したいですね。
チェスより先に将棋が停滞するとか信じがたいというか、チェスでさえまだ伸びしろがあるのに将棋が先に停滞したらなんか恥ずかしい気さえします。
> 将棋が先に停滞したら
チェスよりコミュニティが圧倒的に小さいので…。
コミュニティの小ささは仕方ないところではありますが、それとはまた別の話として、チェスってなんでまだ雑巾絞ることが可能なんですかね?
やねさんは今のコンピュータチェスの残ってる伸びしろってどういうことだと解釈されていますか?
> チェスってなんでまだ雑巾絞ることが可能なんですかね?
コミュニティが大きければ改造のアイデアは尽きないと仮定できます。そうすると、fishtestに参加する人が十分多いので、一つの改造に対して5万回ぐらい回せますから、R2とかR3でも絞っていけるということなのではないでしょうか。
あと、長い持ち時間でのテストは現状のStockfishでも十分ではないと思います。このへんがもう少し何とかなれば、今後、長い持ち時間での棋力はさらに伸びるでしょうね。