昨日の記事のコメント欄で教えてもらった手順が、やねうら王の王手将棋エディションで回避できない。
「コンピューター将棋全般」カテゴリーアーカイブ
王手将棋専用評価関数ファイルV1が出来ました
やねうら王 王手将棋エディションで使える、王手将棋専用評価関数ファイルV1を作ってみたので王手将棋に詳しい人たちはちょっと試して欲しい。
王手将棋専用評価関数ファイルV1
https://drive.google.com/file/d/0Bzbi5rbfN85NOEF6QWFienZrSDg/view
4スレ1秒,3秒で真やねうら王からR300ぐらい向上している…ようだ。自分でもにわかに信じられないが、囲い方が全く違うので、本当に強くなっているのかも知れない。検証求む!
王手将棋は本将棋とどれくらい異なるのですか?
王手将棋は本将棋の評価関数など搭載するぐらいなら計算力に任せてひたすら読みに徹するほうが強いのではないかというコメントを頂戴したが、決してそんなことはない。
読み太のソースコード公開について
読み太のソースコードがGitHubで公開されました。
コンピュータ将棋の新しい用語「雑巾絞り」「リセマラ」
コンピュータ将棋界に新しく誕生した用語「雑巾絞り」。大規模学習(強化学習)によって、少しずつ評価関数を強くしていく手法。元はponanzaチームのインタビュー記事から生まれた言葉でした。
Ponanza Quartetの名前の由来
現在のPonanzaの前身として、C#で書かれたPonanza Quartetというソフトがあり、そのソースコードが公開されていました。(8年ぐらい前?)
続きを読む
学習時のrmseについて
やねうら王ライブラリを用いて、雑巾絞りがうまく出来ているときは、概ね以下のようなグラフになります。(使用教師局面数 = 20億)
ポストビッグデータとしての強化学習が将棋ソフトを変えた
Bonanzaメソッドが公開されたとき(2006年〜)、棋譜さえあれば将棋ソフトは自動的に強くなるのではないかと人々は思った。
KKP16bit化とは何か?
ときどき出てくる「KKP16bit化」の意味について(何度も聞かれるのも嫌なので)詳しく書いておきます。
KPPTからKKPT型評価関数へ
Apery、魔女、真やねうら王ともにKPPT(KPPの3駒関係×手番)を採用していますが、ponanzaは、KKPのほうだけ手番があって、KPPのほうには手番はないそうです。(オープンにしていい情報のようなので書きました。私や平岡さんはずいぶん前に下山さんから聞いて知っていましたが…)