やねうら王チーム、WCSC29(第29回 世界コンピュータ将棋選手権)の参加申し込みしました。
投稿者「やねうらお」のアーカイブ
AlphaZero Shogiの学習にかかるコストを試算してみた
AlphaZero Shogi弱すぎクソワロタ
AlphaZeroのShogi版は、あっという間に従来の将棋ソフトを抜き去ったかのように喧伝されているので今回はここで少しばかり反論したい。
フロッピーディスクに収まる評価関数バイナリ公開しました
NNUE評価関数は、ネットワーク構成を簡単にカスタマイズできるようになっている。
そこで、入力をK(玉のいる升)とP(どの升にどの駒がいるかに対応する値)だけにして(81升 + 1629通り = 1710)、hidden層の1層目を256×2、2層目・3層目を32にして学習させた。(K-P-256-32-32) NNUEを知らない人のために書くと、各層は全結合。
『将棋神やねうら王』と『激指定跡道場4』とではどちらがどれくらい強いのですか?
『激指14』より、『激指定跡道場4』のほうが発売が新しく、思考エンジンに改良が加えられているらしいのですが、では、その『激指定跡道場4』と『将棋神やねうら王』とでは、どちらがどれくらい強いのでしょうか?
やねうら王、新年の抱負を語る
昨年の12月ぐらいから家のなかが寒くなってきたのでPCをフル稼働させるに至った。PCさえ動いていれば何でも良かった。ただ(PCの背面からの)温もりだけが欲しかった。
NNUE評価関数の学習方法について
やねうら王でNNUE評価関数の学習をする方法について解説記事がなかったのでざっとまとめておきます。
『将棋神やねうら王』がWindows7無印で動かない件
『将棋神やねうら王』のアマゾンのレビューで、Windows7無印(SP1なし)で動かないという理由で☆1になっているレビューが2つある。今回、この件について、私の考えを述べたい。
コンピュータ将棋プログラマが白旗を上げ始めたようです。
コンピュータ囲碁の世界では、長きに亘り良い評価関数を設計できずに苦心していました。評価関数というのは、人間で言うと大局観に当たる部分です。この部分をうまく設計するのが強い囲碁ソフトを作る上で必要不可欠なのですが、それは職人のような作業だと言われていました。
2倍の思考時間を使うと人間はR200上がるという根拠について
2つ前の記事で、「将棋ソフトでは、2倍の思考時間を使うとR200程度上がります。R200は勝率で言うと約76%。」というのを人間にも当てはめたのですが、それは人間では成り立たないのでは?という意見が散見されるのでこれに対して私の考えを書いておきます。