電王トーナメント直前ですが、AWSを使って機械学習で使う教師局面を生成してみようと思い、昨日実際にやってみたので、そのノウハウを書いておきます。ノウハウというか、たぶんLinuxに慣れているような人なら誰でも知っているはずのことで、誰得記事ではあるのですが、私は大いに躓いたので記録として残しておきます。
投稿者「やねうらお」のアーカイブ
BonaPiece inverse hackとは何か?
BonaPiece inverse hackという新しいアイデアを思いついたので簡単に書いておきます。
続きを読む
KPP interleaveとは何ですか?
銀座でelmoの瀧澤さんなどSDT5の参加予定の開発者でミニオフ会をしたのですが、集合までに時間があったのでドワンゴ本社の会議室を使わせてもらって、Qhapaqの澤田さん相手に、私が考えたKPP interleaveという技法を解説していました。
やねうら王、KPP_KKPT型評価関数に対応しました
Q) KPP_KKPT型評価関数とは何ですか?
A) KPPT型に比べて、KPPの手番は用いないことにしたものです。評価関数ファイルのサイズが約半分になります。
eta可変絞りについて
SDT5に向けて徐々に手持ちの情報を公開していきます。
やねうら王の学習部はAdaGradを用いている。勾配をgとして、gの二乗を足し合わせたものを記憶しておき、これを基準にwを更新する。
過去5年間の将棋ソフトの変遷
今年のSDT(将棋電王トーナメント)の開催日が発表になりましたね。11月の11,12日だそうです。参加予定の皆さんの開発は捗っているでしょうか?やねうら王はまだ1㍉も強くなってませんが。
lambda混合絞りについて
やねうら王に1ヶ月ほど前につけたlambda混合絞りについて、なんとかちゃんねるで盛り上がっているようなのでこの機能について簡単に解説しときます。
続) 評価関数をブリードすると何故強くなるのですか?
前回記事の続き。やねうら王の学習部をAperyと比較するところから。前回記事の続き。やねうら王の学習部をAperyと比較するところから。
プロ棋士と最新のソフトとの適切な手合は?
以前、羽生さんが「将棋の神様との手合(ハンデ)は?」と尋ねられて「角落ちならなんとか。香落ちではだめですね」のように答えた。(この質問には、何度も色んなメディアに対して答えている。)
評価関数をブリードすると何故強くなるのですか?
評価関数を合成するのが流行っている。ここで言う合成とは、2つの評価関数のそれぞれのパラメーターを足して2で割ることである。ブレンドと呼ばれている。