今年もまたこの季節がやってきた。今回の選手権は、昨年優勝したdlshogiチーム、A100×8の8,9台構成だと言うではないか。(つまりはA100が6,70基あるってこと) AWSで借りるなら1時間4万円ぐらいかかる。
続きを読む投稿者「やねうらお」のアーカイブ
レビュー:探索アルゴリズム実践入門
将棋プログラムK1.5の無駄合判定アルゴリズムについて
詰将棋の無駄合の定義について(長文)
詰将棋ルーチンを書いていると詰将棋の無駄合のルールがとてもややこしいことに気づきます。本当にややこしいので、無駄合を考慮する詰将棋ルーチンはプログラマーなら誰も書きたがらないことが多く、一部の開発者以外この問題と正面から向き合おうともしていません。
続きを読むアマ四段が解けない10級でも解ける将棋の次の一手問題
lishogiという将棋の対局サイトでは、次の一手問題が出題されてそれに解答していくとR(レート)が上がっていき、自分のレートがわかるという仕組みがある。
続きを読むPolicyNetworkだけの将棋ソフトの強さは?
いまのDeep Learning系の上位の将棋ソフトは、AlphaZeroのアーキテクチャに倣っていて、局面を入力し、Policy(次のよさげな一手が最大値になる)とValue(期待勝率)を出力している。では、Policyだけで1手も先の局面を調べない場合、どれくらいの強さになるのだろうか?
続きを読むクラウド最安のGPUについて
渡辺名人が購入した130万円のパソコン、クラウドでそれと同じ性能のもの、1時間50円で使えるよとツイートしたらえらくバズった。
続きを読む誰もdlshogiには敵わなくなって将棋AIの世界が終わってしまった件
いま大会上位に位置するDeep Learning系の将棋AIは、評価関数として画像認識などでよく使われているResNetを用いている。ResNetについては機械学習を齧っている人ならば誰でも知ってるぐらい有名だと思うので、詳しい説明は割愛する。(ググれば詳しい説明がいくらでも出てくる)
続きを読むNNUE評価関数、新しい時代の夜明け
いま、将棋AIの世界はdlshogiに代表されるDeep Learning型の将棋ソフトと、αβ探索を用いる従来型の将棋ソフトとに大きく二分される。後者の上位ソフトは、評価関数にNNUE評価関数を採用しており、後者のタイプのソフトはNNUE型と呼ばれるほどの一大勢力を築き上げている。
このNNUE評価関数を設計したのは、tanuki-チーム(当時)の那須さんである。NNUEは浅い層からなるニューラルネットワークだが、那須さんの実装は、C++ templateで書かれていて、層を増やしたり特徴量の数を変更したりできるようになっていた。
続きを読む対局ゲーム標準通信プロトコルの提案
将棋AIは現在のほとんどの将棋ソフトはUSIプロトコルというプロトコルを採用している。これはチェスAIのプロトコルであるUCIプロトコルをそのまま将棋に転用したものであり、長年の運用により特に大きな問題がないことが実証されている。
続きを読む