何故、将棋の機械学習で天国と地獄メソッドが必要なのか?

今回、私はWCSC31ではみざうら王チームとして参加する。やねうら王に、水匠開発者のたややんさん、やねうら王のメンテナーのMizar(ミザー)さんが加わった形なので、水匠の「水」とMizarさんの「ざー」から、「みざうら王」という名前になった。

続きを読む

GCTの学習メソッドは強化学習の常識を覆すかも知れない

昨年の将棋ソフトのオンライン大会である電竜戦で優勝したGCT。最近、floodgate(コンピュータ将棋のオンライン対局場)にgcttest_x6_RTX2080tiという強いソフトが登場した。これはそのGCTの開発者である加納さんが放流されている評価関数の育成中のGCTである。このソフトが2080TiというGPUの性能からすると強すぎるので、2080Tiの6枚刺しではないか、シングル(1枚刺し)だろという議論(罵り合い?)がなんとかちゃんねるでさかんに行われている。

続きを読む

第31回世界コンピュータ将棋選手権は前年の優勝ソフトに9割勝つソフトがスタートライン

来る5月のゴールデンウィークに第31回世界コンピュータ将棋選手権が開催されます。COVID-19の感染拡大状況を考慮し、オンライン開催であることが決定しています。

続きを読む

俺氏、将棋が二人零和有限確定完全情報ゲームでないことに気づいてしまうwww

このブログをご覧の方は将棋が二人零和有限確定完全情報ゲームであることはご存知でしょう。これは、ゲーム理論や探索アルゴリズムの教科書にでも載っています。「二人零和有限確定完全情報ゲームって何?」って方は、Wikipediaでも見ていただくことにして話を先に進めます。

続きを読む

Deep Learningを使った将棋ソフトは詰将棋ルーチンがないとどれだけ弱くなるのか?

ふかうら王 3kn(3000ノード固定,評価関数GCT) VS 水匠 300kn(30万ノード固定)での対局で、これがほぼ互角のようなので、詰将棋ルーチンを無くすとどれだけ強さが変わるのかを検証してみた。

続きを読む

将棋ソフト、長時間の対局は、Deep Learning系に軍配が上がるのか?

Deep Learning系の将棋ソフト(ふかうら王)と、やねうら王(評価関数:水匠)とで、長時間にした時にどちらのほうが棋力の伸びが大きいかについて計測したので公開する。

続きを読む

BitCoinが値上がりすぎて将棋ソフトの開発ができない件

昨年11月に行われた電竜戦ではDeep Learningを用いた将棋ソフトGCT(エンジン部dlshogi)が優勝して、半年後のWCSC31(第31回 世界コンピュータ将棋選手権)では、Deep Learning勢しか決勝日には残れないのではないかと私は予想した

続きを読む