アンサンブル学習
サンプル効率
アルゴリズムが環境との最小限の相互作用で学習する能力の測定値で、知識の効率的な転送とターゲットを絞った探索を可能にするアンサンブルによって向上する。データコストの高いRLアプリケーションにとって重要。
← 戻るアルゴリズムが環境との最小限の相互作用で学習する能力の測定値で、知識の効率的な転送とターゲットを絞った探索を可能にするアンサンブルによって向上する。データコストの高いRLアプリケーションにとって重要。
← 戻る