取る一手将棋が強化学習でほとんど強くならない件

取る一手将棋は初手96歩に後手が94歩と受けた時点で先手必勝らしい。蛇のように連なる駒の末端に齧りついたが最後、死するか、すべてを飲み込むまで自分の意志で中断することは出来ない。このように長手数の一直線の手順が問題となるようなゲームにおいて、3駒関係はあまり役には立たない。

続きを読む

Windowsのプロセッサーグループの件

以前、Windowsだと1つのソフトから最大で論理64コアまでしか使えないので、いまどきの44コア88スレッドのようなPCだと全コア使い切れなくてどうすんねんみたいな話を書いたが、Stockfishの最新版で、全コアを使い切れるようなcommitがあった。参考のためURLを貼り付けておく。

続きを読む

強化学習の途中でのアーキテクチャーの変更

強化学習を用いて機械学習をさせているときに、エージェントのアーキテクチャーを途中で変更したいことが多々あります。将棋ソフトで言うと評価関数の形を途中で変更したいということですね。

続きを読む

王手将棋用評価関数ファイルV3を公開しました

王手将棋用の評価関数ファイルV2を公開して、わずか数時間で必勝法を見つけてこのブログにコメントをくださった人がいた。本当、インターネットは凄い人博覧会である。これには参った。

続きを読む

王手将棋用評価関数ファイルV2を公開しました

王手将棋用評価関数ファイルV1で真やねうら王の評価関数からR300上がった時は驚きだっだったが、王手将棋用評価関数ファイルV1からさらにR340ほど上げることに成功したので、ここに公開する。

続きを読む