強化学習の途中でのアーキテクチャーの変更

強化学習を用いて機械学習をさせているときに、エージェントのアーキテクチャーを途中で変更したいことが多々あります。将棋ソフトで言うと評価関数の形を途中で変更したいということですね。

このとき、前回生成した教師データをそのまま使いまわすとゼロから学習させなくて済んで経済的です。これに対する用語がなくて困っていたのですが、探索の用語であるIID(多重反復深化 : Internal Iterative Deepening)にちなんで、IIZ(多重反復雑巾絞り : Internal Iterative Zoukining)という用語を思いつきました。

使用例)
「先にdepth 10で教師を生成しといて、あとでfeature追加して、IIZすっかー」

とても便利な用語なので皆さんも活用してみてください。


コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です