プロ棋士の谷合廣紀四段がBERTを使った将棋ソフトを作られました

東大の博士課程の学生でありながらプロ棋士である谷合廣紀四段が、BERT+MCTSを使った将棋ソフトを作られました。ソースコードも公開されています。盤面を言語(95文字の文章)と捉えて、それをBERTに入力しているようです。

続きを読む

MCTSでは普通モンテカルロ法は使われていませんという話

将棋や囲碁で用いているMCTS(Monte Carlo tree search)では、末端の局面でplayout(rollout)として局面評価のためにNN(ニューラルネット)を呼び出している。つまりは、実際にはplayoutは行っていない。

続きを読む

MCTSの超並列化について

将棋ソフトで使われている技術は将棋以外の分野で役に立つことは少ないのだが、Deep Learning系の将棋ソフトで使われている技術、例えばMCTS(モンテカルロ木探索)は、わりと広範な応用事例がある。

続きを読む

WCSC31でPALが学習に用いた計算資源の量

WCSC31(第31回 世界コンピュータ将棋選手権)で、2位に輝いたDeep Learning系の将棋ソフトであるPAL。その学習のためにHEROZの社内のマシンが使われているといる話がありましたが、その具体的な分量については不明でした。今回、Wantedlyのインタビュー記事でその情報が公開されました。

続きを読む

DL系の将棋ソフトは何故CPUだけで動かすと弱いのですか?

囲碁ソフト(例えばKataGoや『天頂の囲碁』(マイナビ))は、CPUで動かしてもそこそこ強いらしい。それに比べて、DL(Deep Learning)を用いている将棋ソフトはCPUで動かすと何故こんなに弱いのか(※ ただしトッププロよりは強い)という質問というか罵声というか、ときには言葉の暴力みたいなのがやってくる。中には、KataGoみたいにopcl(OpenCL)を使わないから弱いんだろ、将棋の開発者は開発を怠っている、みたいな意見があったり、「将棋の開発者が開発にお金をかけないのが悪い。やねさんのお小遣いでやったぐらいでおっつかないだろ」みたいに言う人もいる。

続きを読む

WCSC31に向けてHEROZが本気を出し始めたようです

NVIDIA A100というGeForce RTX 3090の3倍ぐらいの性能のGPUがあって、AWSだとA100×8、GCPだとA100×16というインスタンスが借りられる。前者の料金は1時間4000円弱、後者はその倍程度である。

続きを読む

ここに来てAobaZeroがさいつよの可能性が出てきた件

AobaZeroはDeepMind社のAlphaZeroの追試をその目的としたプロジェクトであった。教師生成(棋譜生成)の部分をアウトソーシング化(?)してあり、誰でもGoogle Colabで棋譜生成に協力できるようになっていた。生成された教師は公開されており、誰でも利用することができた。昨年の電竜戦で優勝したGCTもAobaZeroの棋譜を利用していたし、他のdlshogiチルドレン(?)も、AobaZeroの棋譜にはずいぶんお世話になっているはずである。

続きを読む