電王トーナメント裏話その3

いくつか書いてなかった機械学習関係の話を書いていきます。

習甦の竹内さんと

やね「今年の習甦は強くなってるんですか?」
竹内「なってない(苦笑)」
やね「なんで強くしないんですか!」
竹内「だって…忙しくて…ゴニョゴニョ…」
やね「非線形な評価関数を使ってるの、習甦だけでしょう?だから、習甦が強くなってくれないと、非線形な評価関数自体が駄目なのかなぁって思ってしまうんですよ」
竹内「非線形な評価関数…駄目かも(苦笑)」
やね「何言ってるんですか!習甦には頑張ってもらわないと!だいたい弱いソフトが採用しているアイデアって採用したくないじゃないですか?」
竹内「ええ」
やね「他のソフトが採用して失敗した地雷のようなアイデア、採用したくないじゃないですか?だから習甦には頑張ってもらわないと…」
竹内「非線形な評価関数が…地雷かも(苦笑)」
やね「(苦笑)」

Seleneの西海枝さんと

やね「Seleneの学習部って、前回のままですか?」
西海枝「ええ。終局までシミュレーションして、勝ったほうの指し手に報酬を与えてます」
やね「それってRootStrapと比べて報酬の地点が遠すぎないですか?」
西海枝「でも学習ちゃんと出来てますよ。やねさんも試してみてくださいよ。」
やね「学習部のソースコード、もらえるなら、やってみますよ?」
西海枝「ソースコードは(色々秘密のノウハウがあるので)出せません(笑)」
やね「なんでやの!こっちはRootStrapで成功してて、RootStrapより時間がかかって、かつ、強くなってないものをなんで試さんといかんの!逆じゃないの?そっちがRootStrap実装して比較すべきなんじゃないの?」
西海枝「(笑)」

技巧の出村さんと

私と出村さんが話しているときに誰か(名人コブラの作者?)から質問があったので。

誰か「RootStrapとTreeStrapとでは、TreeStrapのほうが優れてるんですか?」
やね「TreeStrap、あれ怪しいですよ。兄弟ノードではRootStrapより浅い探索での評価値を使っていることになるので、RootStrapより優れているということは絶対にないと思うんですよね…ってブログで書いたら、どこやらから強烈な突っ込みが入りそうなので怖くて自分のブログでは書けませんが(笑)」
出村「あの論文の調査の仕方自体がおかしいですよね…。(と言いながらすぐに論文を出してくる出村さん) このグラフとか、もっと右側まで計測を続けて行ったら、RootStrapとTreeStrapの棋力が入れ替わりそうですし。」
やね「ええ、ええ。」

※ ここで出村さんの出してきた論文は、これで、この7ページ目のグラフ、もう少し右側まで計測しないといけないんじゃないかという話です。

電王トーナメント裏話その3」への2件のフィードバック

  1. ここは墾田永年私財法でまさかりしないと。ってなんのこっちゃ。

    出村さん有能ですね。
    そこに痺れる憧れる。

やねうらお へ返信する コメントをキャンセル

メールアドレスが公開されることはありません。 が付いている欄は必須項目です