やねうらお について

BM98,BMSの生みの親 / ヒルズにオフィスのある某社CTO / プログラミング歴37年(5歳から) / 将棋ソフト「やねうら王」開発者 / 音楽理論ブログ / 天才(らしい) / 毎日が楽しすぎて死にそう

WCSC31でDeep Learning勢が振るわなかったのは何故ですか?

WCSC31(第31回 世界コンピュータ将棋選手権)の決勝に進出した8チームのうちDL勢はPALのみ。昨年末の電竜戦で優勝したGCTは、そこから+R250ぐらいになっているにも拘らず予選落ち。強くなっているとは何だったのだろうか?

続きを読む

WCSC31に向けてHEROZが本気を出し始めたようです

NVIDIA A100というGeForce RTX 3090の3倍ぐらいの性能のGPUがあって、AWSだとA100×8、GCPだとA100×16というインスタンスが借りられる。前者の料金は1時間4000円弱、後者はその倍程度である。

続きを読む

ここに来てAobaZeroがさいつよの可能性が出てきた件

AobaZeroはDeepMind社のAlphaZeroの追試をその目的としたプロジェクトであった。教師生成(棋譜生成)の部分をアウトソーシング化(?)してあり、誰でもGoogle Colabで棋譜生成に協力できるようになっていた。生成された教師は公開されており、誰でも利用することができた。昨年の電竜戦で優勝したGCTもAobaZeroの棋譜を利用していたし、他のdlshogiチルドレン(?)も、AobaZeroの棋譜にはずいぶんお世話になっているはずである。

続きを読む

何故、将棋の機械学習で天国と地獄メソッドが必要なのか?

今回、私はWCSC31ではみざうら王チームとして参加する。やねうら王に、水匠開発者のたややんさん、やねうら王のメンテナーのMizar(ミザー)さんが加わった形なので、水匠の「水」とMizarさんの「ざー」から、「みざうら王」という名前になった。

続きを読む

GCTの学習メソッドは強化学習の常識を覆すかも知れない

昨年の将棋ソフトのオンライン大会である電竜戦で優勝したGCT。最近、floodgate(コンピュータ将棋のオンライン対局場)にgcttest_x6_RTX2080tiという強いソフトが登場した。これはそのGCTの開発者である加納さんが放流されている評価関数の育成中のGCTである。このソフトが2080TiというGPUの性能からすると強すぎるので、2080Tiの6枚刺しではないか、シングル(1枚刺し)だろという議論(罵り合い?)がなんとかちゃんねるでさかんに行われている。

続きを読む