モデルベース強化学習

📂

サブカテゴリ

Dyna-Qによる学習

学習したモデルを使用してシミュレートされた経験を生成し、直接学習と計画を組み合わせるハイブリッドアルゴリズム。

19 用語

📂

サブカテゴリ

モンテカルロ木探索計画

モデル化された環境で将来のアクションを評価するためにランダムシミュレーションを使用する決定木探索アルゴリズム

19 用語

📂

サブカテゴリ

想像による学習

内部モデルを使用して精神的にシナリオをシミュレートし、実際の相互作用なしに学習を加速させる技術。

13 用語

📂

サブカテゴリ

ワールドモデル

潜在空間で計画を行うための環境の圧縮表現と遷移モデルを学習するアーキテクチャ

11 用語

📂

サブカテゴリ

アンサンブル学習

複数の学習済みモデルを使用して不確実性を定量化し、意思決定の頑健性を向上させるアプローチ

14 用語

📂

サブカテゴリ

モデル微分学習

微分可能な環境モデルを通して勾配を伝播させることでポリシーを直接最適化する手法

11 用語

📂

サブカテゴリ

モデルベースの好奇心に基づく学習

モデルの予測誤差を内発的シグナルとして環境の探索を導くシステム

12 用語

📂

サブカテゴリ

モデルベース階層学習

異なる時間スケールのモデルを組み合わせ、長期的な視野での効率的な計画を行うための多階層構造

14 用語

📂

サブカテゴリ

軌道予測による学習

実行前に行動の結果を評価するため、未来の状態系列を予測することを学習する予測モデル

15 用語

📂

サブカテゴリ

転移学習モデルベース学習

類似環境間でモデルの知識を転送し、新しいタスクへの適応を加速させる手法。

13 用語

📂

サブカテゴリ

MuZero

遷移モデル、報酬モデル、価値モデルを動力学の事前知識なしで同時に学習する高度なアルゴリズム。

13 用語

📂

サブカテゴリ

アクティブラーニングによる学習

モデルの学習効率を改善するために、最も情報量の多い経験を能動的に選択する戦略。

7 用語

AI用語集

Dyna-Qによる学習

モンテカルロ木探索計画

想像による学習

ワールドモデル

アンサンブル学習

モデル微分学習

モデルベースの好奇心に基づく学習

モデルベース階層学習

軌道予測による学習

転移学習モデルベース学習

MuZero

アクティブラーニングによる学習

結果が見つかりません