ここに来てAobaZeroがさいつよの可能性が出てきた件

AobaZeroはDeepMind社のAlphaZeroの追試をその目的としたプロジェクトであった。教師生成(棋譜生成)の部分をアウトソーシング化(?)してあり、誰でもGoogle Colabで棋譜生成に協力できるようになっていた。生成された教師は公開されており、誰でも利用することができた。昨年の電竜戦で優勝したGCTもAobaZeroの棋譜を利用していたし、他のdlshogiチルドレン(?)も、AobaZeroの棋譜にはずいぶんお世話になっているはずである。

続きを読む

何故、将棋の機械学習で天国と地獄メソッドが必要なのか?

今回、私はWCSC31ではみざうら王チームとして参加する。やねうら王に、水匠開発者のたややんさん、やねうら王のメンテナーのMizar(ミザー)さんが加わった形なので、水匠の「水」とMizarさんの「ざー」から、「みざうら王」という名前になった。

続きを読む

GCTの学習メソッドは強化学習の常識を覆すかも知れない

昨年の将棋ソフトのオンライン大会である電竜戦で優勝したGCT。最近、floodgate(コンピュータ将棋のオンライン対局場)にgcttest_x6_RTX2080tiという強いソフトが登場した。これはそのGCTの開発者である加納さんが放流されている評価関数の育成中のGCTである。このソフトが2080TiというGPUの性能からすると強すぎるので、2080Tiの6枚刺しではないか、シングル(1枚刺し)だろという議論(罵り合い?)がなんとかちゃんねるでさかんに行われている。

続きを読む

第31回世界コンピュータ将棋選手権は前年の優勝ソフトに9割勝つソフトがスタートライン

来る5月のゴールデンウィークに第31回世界コンピュータ将棋選手権が開催されます。COVID-19の感染拡大状況を考慮し、オンライン開催であることが決定しています。

続きを読む

Deep Learningを使った将棋ソフトは詰将棋ルーチンがないとどれだけ弱くなるのか?

ふかうら王 3kn(3000ノード固定,評価関数GCT) VS 水匠 300kn(30万ノード固定)での対局で、これがほぼ互角のようなので、詰将棋ルーチンを無くすとどれだけ強さが変わるのかを検証してみた。

続きを読む

多くの将棋ソフトで256手ルールの実装がバグっている件

256手ルールというのは、電王トーナメントなどで採用されていた、256手に達したら引き分けというルールである。強いプレイヤー同士の対局では平均手数が伸びる傾向にあるようで、最近ではコンピュータ将棋の対局でも入玉模様の将棋の割合が増えてきたため、WCSC29では320手、電竜戦では512手に変更されている。以下では規定の手数になれば引き分けとなるルールのことを「256手ルール」と書く。

続きを読む

『水匠』の何が強かったのか?

昨年の世界コンピュータ将棋オンライン大会で優勝したソフト、水匠。

大会では、水匠は探索部にmブランチを用いて、かつ、スリッパ(AMD Ryzen Threadripper 3990X)を使用していました。そのせいか、「水匠が優勝したのは、mブランチとスリッパのおかげだろw」と言う声がなくもありません。

続きを読む

WCSC31にはDL勢しか決勝日に残らない(予言)

やねうら王の定跡生成のためにMCTS(モンテカルロ木探索)の探索部書いてたんですよ。まあ、半日ぐらいでだいたい書けて、ふと思ったんです。あれ?これ、dlshogiの評価関数呼び出せるようにしたら、dlshogiなんじゃね?と。

続きを読む