Q) KPP_KKPT型評価関数とは何ですか?
A) KPPT型に比べて、KPPの手番は用いないことにしたものです。評価関数ファイルのサイズが約半分になります。
「やねうら王」カテゴリーアーカイブ
eta可変絞りについて
SDT5に向けて徐々に手持ちの情報を公開していきます。
やねうら王の学習部はAdaGradを用いている。勾配をgとして、gの二乗を足し合わせたものを記憶しておき、これを基準にwを更新する。
過去5年間の将棋ソフトの変遷
今年のSDT(将棋電王トーナメント)の開催日が発表になりましたね。11月の11,12日だそうです。参加予定の皆さんの開発は捗っているでしょうか?やねうら王はまだ1㍉も強くなってませんが。
lambda混合絞りについて
やねうら王に1ヶ月ほど前につけたlambda混合絞りについて、なんとかちゃんねるで盛り上がっているようなのでこの機能について簡単に解説しときます。
続) 評価関数をブリードすると何故強くなるのですか?
前回記事の続き。やねうら王の学習部をAperyと比較するところから。前回記事の続き。やねうら王の学習部をAperyと比較するところから。
評価関数をブリードすると何故強くなるのですか?
評価関数を合成するのが流行っている。ここで言う合成とは、2つの評価関数のそれぞれのパラメーターを足して2で割ることである。ブレンドと呼ばれている。
relmoの世界
Q.relmo(リルモ)とは何ですか?
A.リゼロ評価関数とelmo(WCSC27)の評価関数を1:1でブレンドしたものです。rezero + elmo = relmo。
【解決】gensfenで教師局面生成時に遅くなる問題
やっと解決した(気がする)
開発者向けに原因を手短に書いておく。しかし、これがめっちゃ長い。
やねうら王 vs 読み太
読み太は進行度を用いている。前回の電王トーナメントのときに「進行度、絶対入れたほうがいいっすよ!」と私が読み太の塚本さんに言ったからだ。その当人である私は、やねうら王に進行度を入れてない。なんなんだ、お前と言われそうであるが、忙しくてそこまで手が回っていないのである。
評価関数のキメラ化コマンド公開しました
『Shivoray』(全自動雑巾絞り機)以降、誰でも評価関数を自分で育成することが出来るようになった。教師局面の生成に用いる定跡を変えることで異なった進化を遂げることも徐々に明らかになってきた。今回はこの流れを加速すべく、キメラ化コマンドを公開することにした。