読み太のソースコードがGitHubで公開されました。
投稿者「やねうらお」のアーカイブ
なぜ私にとってMacBookが最高のノーパソなのか
去る10月27日、新型MacBook Proの発表があった。日本時間にして、深夜2時。私はパソコンの前に正座して新型MacBook Proの発表を待っていたわけであるが、その重量1.37kgと大型スクリーンに映し出された瞬間、「こら、旧MacBook Airと変わらんがな…」と思い、速攻でAppleの公式サイトを開いて、4月に発売されたMacBook(Early 2016)をポチった。
コンピュータ将棋の新しい用語「雑巾絞り」「リセマラ」
コンピュータ将棋界に新しく誕生した用語「雑巾絞り」。大規模学習(強化学習)によって、少しずつ評価関数を強くしていく手法。元はponanzaチームのインタビュー記事から生まれた言葉でした。
Ponanza Quartetの名前の由来
現在のPonanzaの前身として、C#で書かれたPonanza Quartetというソフトがあり、そのソースコードが公開されていました。(8年ぐらい前?)
続きを読む
学習時のrmseについて
やねうら王ライブラリを用いて、雑巾絞りがうまく出来ているときは、概ね以下のようなグラフになります。(使用教師局面数 = 20億)
ポストビッグデータとしての強化学習が将棋ソフトを変えた
Bonanzaメソッドが公開されたとき(2006年〜)、棋譜さえあれば将棋ソフトは自動的に強くなるのではないかと人々は思った。
KKP16bit化とは何か?
ときどき出てくる「KKP16bit化」の意味について(何度も聞かれるのも嫌なので)詳しく書いておきます。
真やねうら王のfootprintを下げる話
真やねうら王が自分の使っているスマホで動かないのはツライので動くようにしたいと考えている。
KPPTからKKPT型評価関数へ
Apery、魔女、真やねうら王ともにKPPT(KPPの3駒関係×手番)を採用していますが、ponanzaは、KKPのほうだけ手番があって、KPPのほうには手番はないそうです。(オープンにしていい情報のようなので書きました。私や平岡さんはずいぶん前に下山さんから聞いて知っていましたが…)
探索における枝刈りの階層性
電王トーナメントのときにtanuki-.さんとの会話から。