やねうらお について

BM98,BMSの生みの親 / ヒルズにオフィスのある某社CTO / プログラミング歴37年(5歳から) / 将棋ソフト「やねうら王」開発者 / 音楽理論ブログ / 天才(らしい) / 毎日が楽しすぎて死にそう

取る一手将棋が強化学習でほとんど強くならない件

取る一手将棋は初手96歩に後手が94歩と受けた時点で先手必勝らしい。蛇のように連なる駒の末端に齧りついたが最後、死するか、すべてを飲み込むまで自分の意志で中断することは出来ない。このように長手数の一直線の手順が問題となるようなゲームにおいて、3駒関係はあまり役には立たない。

続きを読む

王手将棋用評価関数ファイルV6を公開しました

第一学院高等学校での授業が終わったので、新しい評価関数を公開します。前の評価関数に対して+R150。これでサチりました。もうこれが最終です。王手将棋用の定跡ファイルは今後、用意するかも知れません。(公開時期、未定)

続きを読む

Windowsのプロセッサーグループの件

以前、Windowsだと1つのソフトから最大で論理64コアまでしか使えないので、いまどきの44コア88スレッドのようなPCだと全コア使い切れなくてどうすんねんみたいな話を書いたが、Stockfishの最新版で、全コアを使い切れるようなcommitがあった。参考のためURLを貼り付けておく。

続きを読む

強化学習の途中でのアーキテクチャーの変更

強化学習を用いて機械学習をさせているときに、エージェントのアーキテクチャーを途中で変更したいことが多々あります。将棋ソフトで言うと評価関数の形を途中で変更したいということですね。

続きを読む

王手将棋用評価関数ファイルV3を公開しました

王手将棋用の評価関数ファイルV2を公開して、わずか数時間で必勝法を見つけてこのブログにコメントをくださった人がいた。本当、インターネットは凄い人博覧会である。これには参った。

続きを読む

王手将棋用評価関数ファイルV2を公開しました

王手将棋用評価関数ファイルV1で真やねうら王の評価関数からR300上がった時は驚きだっだったが、王手将棋用評価関数ファイルV1からさらにR340ほど上げることに成功したので、ここに公開する。

続きを読む