技巧強すぎワロタ

floodgateに参戦している技巧が強すぎて関係者が騒然となっております。

技巧で用いられている機械学習のアルゴリズムはASGD+αで、私からすれば「まあ、最近はそうするよね」という感じで特に目新しいものではありません。そもそも、近年はよほど変態的な次元下げをしない限りは数日あれば学習はそれなりの値に収束しますし、収束性の速さがソフトの棋力に直接的に寄与するわけではないので(開発のターンアラウンドタイムが短くなるという意味はありますが)、別にそこは1日でも3日でも大差ないと思います。もちろん、この「3日」が「1ヶ月」とか「3ヶ月」とかになると話はまた違ってきますが。

ちなみにやねうら王が学習に用いているやねんざメソッドもSGDを改良したものですが、そのへんは大差ないと思います。やねんざメソッドで安定して収束するかは心配していたのですが、KPP/KKPのKPE次元下げの学習に成功して、Apery(WCSC25)と同じぐらいの棋力(500戦して互角)になりました。(この評価関数は今回は使わない予定ですが)

では技巧の強さの秘訣はどこにあるのでしょうか?まず一言で言うと利きの計算をSSEで実装したことです。詳しくは明日の記事で(体力が残っていたら)書きます。


技巧強すぎワロタ” への5件のコメント

  1. 楽しいPV、ありがとうございました。
    一年ぶりにご尊顔を拝見でき、「またこの季節がやってきたなあ」と実感しております。

    ところで、シャツのメッセージがよめません。
    ネコがどうしたのでしょう?
    それから、やっぱり期待うらぎるのはよくないと思います。

  2. プロモーションビデオ、面白く、3回見直しました。
    互いに、相手が”病気”だと思っている、ようにとれますね。

    ここは、ビデオの流れで、全員、”病気”とかいたTシャツを着て出ると面白いかと。
    (渋谷かどこかで売ってそうな気がする。)

    開発疲れで、本当の病気にならない様にご自愛ください。
    評価パラメータの出産、楽しみです。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です