やねうら王に1ヶ月ほど前につけたlambda混合絞りについて、なんとかちゃんねるで盛り上がっているようなのでこの機能について簡単に解説しときます。
「やねうら王」カテゴリーアーカイブ
続) 評価関数をブリードすると何故強くなるのですか?
前回記事の続き。やねうら王の学習部をAperyと比較するところから。前回記事の続き。やねうら王の学習部をAperyと比較するところから。
評価関数をブリードすると何故強くなるのですか?
評価関数を合成するのが流行っている。ここで言う合成とは、2つの評価関数のそれぞれのパラメーターを足して2で割ることである。ブレンドと呼ばれている。
relmoの世界
Q.relmo(リルモ)とは何ですか?
A.リゼロ評価関数とelmo(WCSC27)の評価関数を1:1でブレンドしたものです。rezero + elmo = relmo。
【解決】gensfenで教師局面生成時に遅くなる問題
やっと解決した(気がする)
開発者向けに原因を手短に書いておく。しかし、これがめっちゃ長い。
やねうら王 vs 読み太
読み太は進行度を用いている。前回の電王トーナメントのときに「進行度、絶対入れたほうがいいっすよ!」と私が読み太の塚本さんに言ったからだ。その当人である私は、やねうら王に進行度を入れてない。なんなんだ、お前と言われそうであるが、忙しくてそこまで手が回っていないのである。
評価関数のキメラ化コマンド公開しました
『Shivoray』(全自動雑巾絞り機)以降、誰でも評価関数を自分で育成することが出来るようになった。教師局面の生成に用いる定跡を変えることで異なった進化を遂げることも徐々に明らかになってきた。今回はこの流れを加速すべく、キメラ化コマンドを公開することにした。
『Shivoray』(全自動雑巾絞り機)公開しました
自分で自分好みの評価関数を作って遊んでみたいという人のために『Shivoray』(シボレー)という全自動雑巾絞り機を公開しました。 続きを読む
棋風を覚える将棋ソフトが完成してた件
リゼロ評価関数のほう、ようやくepoch11にしてelmo(WCSC27)と並んだのだが、穴熊に全然囲わない。穴熊超嫌い。どうやっても穴熊に囲わない。
教師局面生成時のランダムムーブについて
教師局面を生成するときにランダムムーブを入れている。合法手のなかからランダムに1手指させる。これにより、生成される教師局面を散らばらせる働きをする。