🏠 ホーム
ベンチマーク
📊 すべてのベンチマーク 🦖 恐竜 v1 🦖 恐竜 v2 ✅ To-Doリストアプリ 🎨 クリエイティブフリーページ 🎯 FSACB - アルティメットショーケース 🌍 翻訳ベンチマーク
モデル
🏆 トップ10モデル 🆓 無料モデル 📋 すべてのモデル ⚙️ 🛠️ Kilo Code モード
リソース
💬 💬 プロンプトライブラリ 📖 📖 AI用語集 🔗 🔗 有用なリンク

AI用語集

人工知能の完全辞典

236
カテゴリ
3,245
サブカテゴリ
39,334
用語
📂
サブカテゴリ

Behavioral Cloning

専門家のデモンストレーションから直接行動を模倣する教師あり学習。

13 用語
📂
サブカテゴリ

逆強化学習

観察された専門家の行動から最適な報酬関数を推論する。

6 用語
📂
サブカテゴリ

生成的敵対的模倣学習

エージェントの行動と専門家の行動を区別するために敵対的ネットワークを使用します。

12 用語
📂
サブカテゴリ

Dataset Aggregation (DAgger)

エージェントの軌道上で専門家から新しいデータを収集し、ポリシーを改善する反復的な手法。

19 用語
📂
サブカテゴリ

人間のフィードバックからの報酬学習

人間が提供する比較的または質的な評価から報酬を学習する。

14 用語
📂
サブカテゴリ

オフライン強化学習

環境との相互作用なしに固定されたデータセットのみを使用する強化学習。

9 用語
📂
サブカテゴリ

モデルベース模倣学習

環境の動的モデルを構築し、模倣学習を加速させる。

10 用語
📂
サブカテゴリ

メタ模倣学習

わずかなデモンストレーションで新しいタスクを素早く模倣することを学ぶ。

17 用語
📂
サブカテゴリ

階層的模倣学習

複雑な行動を模倣しやすいサブタスクの階層に分解する。

10 用語
📂
サブカテゴリ

マルチモーダル模倣学習

同じタスクに対して複数の有効な解決策を扱い、行動の分布を学習する。

9 用語
📂
サブカテゴリ

自己模倣学習

エージェントは過去の成功した行動を模倣することで、現在の方策を改善します。

17 用語
📂
サブカテゴリ

目標条件付き模倣学習

特定の目標に基づいて様々なタスクを達成するためのポリシーを学習する。

15 用語
📂
サブカテゴリ

逆強化学習への敵対的アプローチ

より頑健な報酬推定のために、逆強化学習と敵対的学習を組み合わせる。

12 用語
📂
サブカテゴリ

部分観察における模倣学習

エージェントが状態の一部のみを観察する環境での模倣学習

14 用語
📂
サブカテゴリ

カリキュラム模倣学習

学習を促進するための難易度が段階的に増加するデモンストレーションの進行シーケンス。

14 用語
🔍

結果が見つかりません