NNUE評価関数のような非線形な評価関数は何故有効なのですか？その２

投稿日時: 2019年2月5日投稿者: やねうらお

前回記事の続きをやっていきましょう。

前回、入力をK(玉のある升 81通り) + P(玉以外の駒の種類・升を表現した通し番号 1548通り)として、1つのニューロンで穴熊に囲えるということを説明しました。

続きを読む →

AlhpaZeroが居飛車を好む件

投稿日時: 2019年1月31日投稿者: やねうらお

コンピュータ将棋に機械学習が導入されたBonanza以降、私はずっと思っているのだが、3駒関係にしても他の駒の配置を暗黙的に仮定しているフシがある。

続きを読む →

NNUE評価関数のような非線形な評価関数は何故有効なのですか？その１

投稿日時: 2019年1月29日投稿者: やねうらお

今回は、NNUE評価関数の一番シンプルな形で何故穴熊に囲えるのかについて解説してみます。

続きを読む →

やねうら王チーム、WCSC29参加申し込みしました

投稿日時: 2019年1月26日投稿者: やねうらお

やねうら王チーム、WCSC29(第29回世界コンピュータ将棋選手権)の参加申し込みしました。

続きを読む →

AlphaZero Shogiの学習にかかるコストを試算してみた

投稿日時: 2019年1月19日投稿者: やねうらお

昨日の記事で、AlphaZeroがどれくらいの強さなのかざっくり試算したのですが、ざっくりすぎてかなりいい加減だったので、LC0(LeelaChessZero)のbenchmarkを元に、正確に計算しなおします。

続きを読む →

AlphaZero Shogi弱すぎクソワロタ

投稿日時: 2019年1月18日投稿者: やねうらお

AlphaZeroのShogi版は、あっという間に従来の将棋ソフトを抜き去ったかのように喧伝されているので今回はここで少しばかり反論したい。

続きを読む →

フロッピーディスクに収まる評価関数バイナリ公開しました

投稿日時: 2019年1月15日投稿者: やねうらお

NNUE評価関数は、ネットワーク構成を簡単にカスタマイズできるようになっている。

そこで、入力をK(玉のいる升)とP(どの升にどの駒がいるかに対応する値)だけにして(81升 + 1629通り = 1710)、hidden層の1層目を256×2、2層目・3層目を32にして学習させた。(K-P-256-32-32) NNUEを知らない人のために書くと、各層は全結合。

続きを読む →

コンピュータ将棋プログラマが白旗を上げ始めたようです。

投稿日時: 2018年12月27日投稿者: やねうらお

コンピュータ囲碁の世界では、長きに亘り良い評価関数を設計できずに苦心していました。評価関数というのは、人間で言うと大局観に当たる部分です。この部分をうまく設計するのが強い囲碁ソフトを作る上で必要不可欠なのですが、それは職人のような作業だと言われていました。

続きを読む →

2倍の思考時間を使うと人間はR200上がるという根拠について

投稿日時: 2018年12月22日投稿者: やねうらお

２つ前の記事で、「将棋ソフトでは、2倍の思考時間を使うとR200程度上がります。R200は勝率で言うと約76%。」というのを人間にも当てはめたのですが、それは人間では成り立たないのでは？という意見が散見されるのでこれに対して私の考えを書いておきます。

続きを読む →

40コア以上でのLazy SMPの効率改善について

投稿日時: 2018年12月20日投稿者: やねうらお

将棋ソフト『PAL』の山口さんからWCSC28のときに、やねうら王およびStockfishのLazy SMPの部分のコードだと、コア数が増えてきた時に同じdepthを探索しているスレッドが増えすぎて良くないのではないかという指摘があった。

続きを読む →

やねうら王公式サイト

コンピューター将棋やねうら王公式サイト

「コンピューター将棋全般」カテゴリーアーカイブ

NNUE評価関数のような非線形な評価関数は何故有効なのですか？その２

AlhpaZeroが居飛車を好む件

NNUE評価関数のような非線形な評価関数は何故有効なのですか？その１

やねうら王チーム、WCSC29参加申し込みしました

AlphaZero Shogiの学習にかかるコストを試算してみた

AlphaZero Shogi弱すぎクソワロタ

フロッピーディスクに収まる評価関数バイナリ公開しました

コンピュータ将棋プログラマが白旗を上げ始めたようです。

2倍の思考時間を使うと人間はR200上がるという根拠について

40コア以上でのLazy SMPの効率改善について