銀座でelmoの瀧澤さんなどSDT5の参加予定の開発者でミニオフ会をしたのですが、集合までに時間があったのでドワンゴ本社の会議室を使わせてもらって、Qhapaqの澤田さん相手に、私が考えたKPP interleaveという技法を解説していました。
「コンピューター将棋全般」カテゴリーアーカイブ
eta可変絞りについて
SDT5に向けて徐々に手持ちの情報を公開していきます。
やねうら王の学習部はAdaGradを用いている。勾配をgとして、gの二乗を足し合わせたものを記憶しておき、これを基準にwを更新する。
過去5年間の将棋ソフトの変遷
今年のSDT(将棋電王トーナメント)の開催日が発表になりましたね。11月の11,12日だそうです。参加予定の皆さんの開発は捗っているでしょうか?やねうら王はまだ1㍉も強くなってませんが。
プロ棋士と最新のソフトとの適切な手合は?
以前、羽生さんが「将棋の神様との手合(ハンデ)は?」と尋ねられて「角落ちならなんとか。香落ちではだめですね」のように答えた。(この質問には、何度も色んなメディアに対して答えている。)
評価関数をブリードすると何故強くなるのですか?
評価関数を合成するのが流行っている。ここで言う合成とは、2つの評価関数のそれぞれのパラメーターを足して2で割ることである。ブレンドと呼ばれている。
まふ評価関数は何故強いのですか?
relmoの世界
Q.relmo(リルモ)とは何ですか?
A.リゼロ評価関数とelmo(WCSC27)の評価関数を1:1でブレンドしたものです。rezero + elmo = relmo。
やねうら王 vs 読み太
読み太は進行度を用いている。前回の電王トーナメントのときに「進行度、絶対入れたほうがいいっすよ!」と私が読み太の塚本さんに言ったからだ。その当人である私は、やねうら王に進行度を入れてない。なんなんだ、お前と言われそうであるが、忙しくてそこまで手が回っていないのである。
評価関数のキメラ化コマンド公開しました
『Shivoray』(全自動雑巾絞り機)以降、誰でも評価関数を自分で育成することが出来るようになった。教師局面の生成に用いる定跡を変えることで異なった進化を遂げることも徐々に明らかになってきた。今回はこの流れを加速すべく、キメラ化コマンドを公開することにした。
棋風を覚える将棋ソフトが完成してた件
リゼロ評価関数のほう、ようやくepoch11にしてelmo(WCSC27)と並んだのだが、穴熊に全然囲わない。穴熊超嫌い。どうやっても穴熊に囲わない。