第2回 マイナビニュース杯電竜戦ハードウェア統一戦がBURNING BRIDGESの優勝で幕を閉じた。
決勝戦
決勝戦は、水匠とBURNING BRIDGESの対局となり、プロ棋士の中村太地八段と鈴木肇氏の漫才のような解説も相まって、エンタメとしても非常に楽しめる内容であった。
決勝戦は、表裏(手番を入れ替えて計2局)の形式で行われた。両局ともに後手番が勝利したため、ルールに従い先後入れ替えての指し直しとなった。
水匠が優勢のまま、相入玉となったのだが、水匠が入玉模様の将棋が下手すぎたため勝負がもつれ、512手まで到達した。規定により、引き分けとなり、電竜戦HWTのルールでは引き分けは後手の0.6勝(先手の0.4勝)とみなすことになっているので、これにより後手のBURNING BRIDGESの優勝を決めた。
関連 : 将棋AIはなぜ入玉がヘタクソになってしまったのか? : https://yaneuraou.yaneu.com/2024/02/05/shogi-ai-is-terrible-at-entering-king-shogi/
手に汗握る熱戦なので、将棋ファンの方は、是非動画を視聴されたい。
近年、先手勝率が7割だと言われている将棋AIの世界で、後手の奮闘ぶりが際立った。第一局では先手必勝と言われる角換りも後手のBURNING BRIDGESが制した。
予選リーグより将棋AIの粗が目立った件について
「予選リーグより、(長い持ち時間なのに)将棋AIの粗が目立った」という意見も出ている。これは、長い持ち時間だと、上のように定跡から外れやすいことや、長手数になると入玉模様となり、水匠の入玉模様の弱さが目についたというのもその理由に挙げられる。
水匠の開発者のたややんさん曰く、「今回の水匠は序中盤の学習に力を入れていたので入玉がおろそかなになっていた」とのことであるが、水匠が入玉模様の将棋が下手なのは、別の理由もありそうだ。その話は長くなるので別の記事に譲る。
玉の屈伸運動について
電竜戦HWTでは開始局面から最初の4手で58玉、52玉、59玉、51玉という指し手(俗に「玉の屈伸運動」と呼ばれる)が入っている。これについて何なのか質問する人が多かったので、ここで説明しておくと、これは先手の持ち時間を減らすための措置である。
将棋AIの大会(WCSC、電竜戦)では、floodgate(将棋AIの対局場)のサーバー側のプログラム(shogi-serverと呼ばれる。Rubyで書かれたスクリプト。ソースコードが公開されている)を用いている。これは、CSAプロトコル(CSA = コンピュータ将棋協会)で将棋AIとやりとりするのだが、CSAプロトコルでは、初手において先手の持ち時間は後手の半分、みたいな感じの非対称な持ち時間についてどう書けばいいか厳密には定義されていない。
なので、shogi-serverのプログラムをいじって変更することは出来なくもないのだが、厳密に定義されていないのでそれをクライアント側のプログラム(将棋AI側)が対応していないかも知れない。そういう危険性がある。
また、いまどきの将棋AIはUSIプロトコルのみを実装している。
そこで、将棋AIがfloodgateやWCSCや電竜戦で戦うためには、USIプロトコルからCSAプロトコルに変換する変換器(アダプターなどと呼ばれる)が必要となる。将棋所でこれらのサーバーに接続する場合は、将棋所がその変換をやってくれる。将棋所では、この非対称な持ち時間設定でもうまく思考エンジンに渡してくれるようなのだが、そのような変換をしてくれるアダプターばかりとは限らないので、そこで事故が起きる危険性もある。
そんなわけで、実装コスト、検証コスト等を考慮すると、4手で元の局面に戻る指し手を挿入して、そこで時間を消費したように扱うのが一番手堅いのだ。
やねうら王の順位について
ちなみに、本大会、やねうら王は予選3位で、そのあと探索部の改良もあったので、優勝してもおかしくない実力を兼ね備えていたと思うのだが、決勝トーナメントの初戦で負けてしまった。(初戦は、裏表ではなく片面のみの勝負)
せっかく予選は総当たりで順位を決めているのだから、決勝トーナメントは(強いソフトが勝ち上がれるように)せめて裏表にして欲しいところであるな…。
DL系が決勝トーナメントにいなかった件について
いまの将棋AIは、DL系(Deep Learningを用いた将棋AI)とNNUE系(従来型の探索部と評価関数の将棋AI)との2つの潮流があるのだが、今回の決勝トーナメントに残ったチームには、DL系は一つもなかった。(NNUE系ばかりであった)
これは、DL系の最大派閥であるdlshogiが大会参加を辞退したというのが大きい。辞退の理由はよく知らないが、本大会はバイナリ提出をしないといけないので(大会運営側のPCで対決させるため)、それを嫌ったのかも知れない。
いまの将棋AIは強化学習をして強くしているのだが、DL系のAIは、教師生成のコストが高くて(GPUを用いて教師生成をしないといけないが、dlshogiと同じ強さにするには、A100×8台×1年とかそれぐらいの生成コストがかかる模様)、dlshogiチーム以外では、教師生成までしているチームが限られているし、dlshogiと同じ規模で教師生成できていないから、その棋力にかなりの差がある。(dlshogiの最新版と他のチームとの比較ではおそらくR100-200ぐらいの差がある。他のチームの大半は、dlshogiの公開バージョンと同じぐらいの強さにしかできていない)
なので、今回のHWTのPCスペック(CPU : Core i9 12900K , GPU : GeForce RTX 3090)においてはNNUE系の方が有利だったようだ。
dlshogiが出場していたら結果も違っていたと思うが、ともかく、このぐらいのPCスペックなら、NNUE系の方が強いということがわかったので、これは将棋AIのためにPCを新調しようと思っている人の参考になるかも知れない。
関連リンク
第2回 マイナビニュース杯電竜戦ハードウェア統一戦(電竜戦公式)
https://denryu-sen.jp/hd2/
電竜戦チャンネル(YouTube)
https://www.youtube.com/@denryusen
周到な用意と多少の運もあったかもあるでしょうが、HalfKP_256x2-32-32 を使用してるっぽいBURNING BRIDGESが優勝したのは面白い結果ですね。ハードが統一されていると、NPSが高いほうが有利な場面も多いのでしょうか。
また、ケルンバやねうら王水匠と、入玉模様で逆転されたソフトは皆HalfKP_1024x2-8-32でマメット・ブンブク・Li系だったのも気になります。かつて水匠が対振りを捨ててNNUE最強となったときと比べ、入玉系は軽視するとここまで派手な影響が出るものなんですかね。
※電竜戦の中継棋譜コメントからの概算による推測です。
BURNING BRIDGESは約22000kNPSで昨年の 256×2-32-32と同等
水匠,Liなど 1024×2-8-32組は約11500kNPSで昨年の1024組と同等のため
ちなみに独自組の氷彗とW@nderERのNPSは大体14000kと15000k程度でした。
中継棋譜コメントからNPSを割り出した猛者が現る…!
昨年AobaZeroの山下さんがされていたのを参考にしただけで、その記事よりも条件とかが雑などんぶり勘定です。総ノード数を棋譜コメントに載せられるのなら、NPSやDepthとかも棋譜コメントに追記してもいいのではと思いますが、、
http://www.yss-aya.com/bbs/patio.cgi?read=34
トーナメントって、少ない持ち時間と秒読みのルールが突ける弱点のように見えてしまう2連覇失敗も起きるような、なにか公平性に欠ける感があるような?