モデルを使用した転移学習

📖

用語

モデルによる転移学習

ソース環境で学習されたダイナミクスモデルを使用して、ポリシーを直接転送するのではなく、世界の構造に関する知識を転送することで、ターゲット環境での学習を加速する技術。

📖

用語

転移可能なダイナミクスモデル

共通の物理的または構造的特徴を共有する異なるタスクや環境間で再利用できるように設計された、環境の状態遷移の数学的表現。

📖

用語

モデルベース強化学習

エージェントが環境の内部モデルを構築し、実世界で行動する前に軌道を計画・シミュレーションすることで、高価な相互作用の必要性を低減するパラダイム。

📖

用語

モデルの一般化

訓練中に観察されなかった状態や行動に対して正確な予測を行うダイナミクスモデルの能力で、環境間の成功した転送に不可欠。

📖

用語

モデル転送バイアス

ソース環境で学習されたモデルが、わずかに異なるダイナミクスを持つターゲット環境に適用されたときに生じる体系的な誤差で、適応技術が必要。

📖

用語

モデルのメタ学習

モデルの初期化パラメータを最適化することで、少数のデータで新しい環境に迅速に適応できるダイナミクスモデルの学習方法を学ぶアプローチ。

📖

用語

潜在環境エンコーディング

環境の本質的な特徴を潜在空間にコンパクトに表現し、異なる環境間の類似性を捉えてモデルの転送を容易にする手法。

📖

用語

転送モデルの較正

転送されたモデルの予測をターゲット環境の統計に合わせるように調整するプロセスで、通常は回帰またはベイズ適応技術によって実行される。

📖

用語

マルチモデル転移

異なるソース環境で学習した専門モデルの集合を組み合わせ、ターゲット環境で堅牢なハイブリッドモデルを形成する戦略。

📖

用語

因子化タスク空間

環境間の変動を独立した因子に分解し、関連するモデルコンポーネントを選択的に転送しつつ、他のコンポーネントを適応させることを可能にする。

📖

用語

モデルベース階層強化学習

異なる時間的・空間的スケールの動力学モデルが転送され、新しい環境での効率的な階層的計画を可能にするアーキテクチャ。

📖

用語

モデル知識蒸留

大規模なソース動力学モデルが、よりコンパクトで転送可能なモデルにその予測を教え、汎化能力を維持する圧縮技術。

📖

用語

動力学モデルのドメイン適応

事前学習された動力学モデルを新しいドメインで機能するように調整し、ソースとターゲットの分布間の発散を最小化することを目的とする手法群。

📖

用語

モデルのゼロショット転移

学習した構造の極端な汎化により、新しい環境で全く適応することなく機能する動力学モデルの能力。

📖

用語

遷移グラフモデル

環境の動力学を、ノードが状態、エッジが確率的遷移であるグラフとして表現し、類似環境間での構造転送を容易にする。

📖

用語

モデルの継続学習

動力学モデルが新しい環境との相互作用中に継続的に更新され、以前に獲得した知識を維持するパラダイム。

📖

用語

モデル合成による転移

単純なサブタスクで学習された基本モデルを組み合わせて、新しい複合環境を処理できる複雑なモデルを形成する手法。

📖

用語

転移における認識論的不確実性

ソース環境で探索されていない状態空間領域における知識不足によるモデルの不確実性の定量化で、安全な転移にとって重要。

📖

用語

ハイブリッドニューロシンボリックモデル

複雑なダイナミクスを学習するためのニューラルネットワークと、基本的な物理的制約を表す転送可能なシンボリックコンポーネントを組み合わせたアーキテクチャ。

📖

用語

モデルの時間間転移

特定の時間スケールで学習されたダイナミクスモデルを、ターゲット環境で異なる時間スケールで効率的に動作させること。

AI用語集