この時期にtwitterやってる場合ではないぞ!
Twitterやってて勝てるんですか?
— 平岡 拓也@Ponanza倒したい (@HiraokaTakuya) November 18, 2015
ましてブログ記事の更新なんて以ての外だ!
という声が飛んで来そうですが、今日も張り切ってブログを更新していきます。
ちなみにやねうら王のほうは、今回は色々不運が重なってもう絶望しかありません。
寝てる間にパラメーターの学習が進んで強くなってるかと思ったら、今度はまたMPIに使ってるネットワークHUBが通信できなくなってましたか。そうですか…。(絶望)
— やねうら王 (@yaneuraou) November 18, 2015
今回はSGD(確率的勾配降下法)の話を手短に。
そういえば激指がSGD使ってないのでコンピュータ将棋に適してないってことなのかと思ってた。
— 瀧澤 誠 (@mktakizawa) November 18, 2015
BonanzaのKPP/KKPのような(激指やGPS将棋と比較して)大規模な評価関数パラメーターを激指メソッド(とかSGDとか)で学習させた論文というのはそれまで存在しなくて、前々回の電王トーナメントぐらいのときにPonanzaチームの下山さんに「何故ないの?出来ないの?」と尋ねたときに、
下山「(個人的には成功すると思っていて)単に誰もやってないだけなんじゃないですかね…」
と言われました。その後、前回の電王トーナメントで下山さんに話を聞いたところ、SGDで三駒関係のパラメーターの学習に成功したとのことでした。
また、激指が何故SGDを使わなかったのかは知りませんが、昨年の電王トーナメントで鶴岡先生に厚かましくも「激指の学習部のソースコードください」とお願いしたところ(ほんま、厚かましいな!)、「SGDでググれカス(意訳)」という有り難いお言葉を頂戴しました。
※ 「いまから勉強するならSGDのほうがいいですよ。SGD勉強しましょう」という感じでした。
激指メソッドとは一体何だったのか…。
そんなわけで、いまからやろうという人は、激指メソッドではなく、SGDでググれカスということで。
やねうらさんが絶望すると
やねうら王・バイツァ・ダストが使えるようになるはずだ!
序盤が優秀なら、中盤の何処かで 新=>旧 評価関数をきりかえるのはどうですか。揺らぎを与えると、貸し出し対策にもなりそうだし。
評価関数(の形)が違うということは、いままでと定数の持つ値が全く違うので、異なるnamespaceに同じ名前の変数入れて二通り持つ、みたいな実装をしないといけなくて、そういうことをすると間違ったほうのnamespaceの変数参照してたりするバグがすごく見つけにくくて、こんな間際に出来ることではないです…。
新しい評価関数、利きが絡んでくるので盤面更新のときにその情報を更新してたりするので、旧評価関数とのハイブリットにするのはすこぶる難しいです。
思考エンジン用のブリッジを作って、中盤あたりで実行ファイルを差し替えるのはアリだと思いますが、(ブリッジ自体は私は1,2時間で作れると思いますが)そのテストとか完璧やるのは結構たいへんだったり…。ブリッジ自体のオーバーヘッドもありますし、あまり気が進みません。
いまはともかく、新しい評価関数のやねうら王が、Apery(WCSC25)と同じぐらいの強さになることを祈るのみです…。
なるほど、です。確かに、締め切り直前に新しい事をやるのはバグが発生しやすくて御法度ですね。
自分は、局面、時間(思考量)管理、最終着手選択を行う部分をMainとし、System Call で 思考部を呼んでおり思考部を置き換えるのは簡単なので、上記の発想になりました。ファイル経由(Ram Diskに置くべき?)で、局面データ等を渡しています。(オーバーヘッドが大きいですね。。。)
ぜひ、超やねうら王 の雄姿を見せてください。
ファイル経由にするぐらいなら標準入出力をリダイレクトするブリッジを書くほうがはるかに速く動作しますが、それでもそのオーバーヘッドが多少なりともあるのであまりやりたくはないですね。
まあ、そうは言っても将棋所も結局ネットワーク対局ですと思考エンジンとのブリッジ的な役割をしていて思考エンジンが直接通信するよりは10msか20msぐらい損をしているような気も…。
期末試験前になると部屋の掃除が捗るてきなアレですよね?>ブログ投稿増加
ですです!
> 収束までにあと100時間
A・W・S!A・W・S!は別にして…この収束ペースだと
トーナメント予選リーグ:スーパーやねうら王
決勝トーナメント初日:スーパーやねうら王2
決勝トーナメント最終日:スーパーやねうら王3
第一期電王戦:スーパーやねうら王4
ですね、分かります。
やねうらお氏
昨年のバージョンからR300~400は上げたいところ。
↓
当日までにApery(WCSC25)よりは強くなって欲しい。
この下方修正 日本のGDPかな?
当日までにApery(WCSC25)よりは強くなって欲しい
↓ 下方修正
当日虫歯が痛まなければ万事オッケー
正直に言うと超やねうら王が優勝するんじゃないかって期待してましたが、ここにきて技巧強すぎて無理かもしれないって気がしてきました。
超やねうら王の指しまわし、見てみたいと思うのですが、、、。
そこそこ強いのなら、是非とも新バージョンで、お願いしますだ。