コンピュータ将棋界に新しく誕生した用語「雑巾絞り」。大規模学習(強化学習)によって、少しずつ評価関数を強くしていく手法。元はponanzaチームのインタビュー記事から生まれた言葉でした。
コンピュータ将棋の新しい用語「雑巾絞り」「リセマラ」
7
コンピュータ将棋界に新しく誕生した用語「雑巾絞り」。大規模学習(強化学習)によって、少しずつ評価関数を強くしていく手法。元はponanzaチームのインタビュー記事から生まれた言葉でした。
やねうら王ライブラリを用いて、雑巾絞りがうまく出来ているときは、概ね以下のようなグラフになります。(使用教師局面数 = 20億)
Bonanzaメソッドが公開されたとき(2006年〜)、棋譜さえあれば将棋ソフトは自動的に強くなるのではないかと人々は思った。
Ponanza開発者の山本くんがASCII.jpに記事を書いていて、これがまためちゃくちゃ面白い記事なので紹介しておきます。
いくつか書いてなかった機械学習関係の話を書いていきます。
オッス!オラ、オライリー!(挨拶)
高校生程度の数学の知識でも、Pythonでニューラルネットのコードが書けるようになっちゃうと評判のDeep Learningの入門書籍なんですけど、amazonでは絶賛売り切れ中です。