BenchVibe AI Ecosystem

VIP 👤

🏠 ホーム

ベンチマーク

📊 すべてのベンチマーク 🦖 恐竜 v1 🦖 恐竜 v2 ✅ To-Doリストアプリ 🎨 クリエイティブフリーページ 🎯 FSACB - アルティメットショーケース 🌍 翻訳ベンチマーク

モデル

🏆 トップ10モデル 🆓 無料モデル 📋 すべてのモデル ⚙️ 🛠️ Kilo Code モード

リソース

💬 💬 プロンプトライブラリ 📖 📖 AI用語集 🔗 🔗 有用なリンク

AI用語集

人工知能の完全辞典

236

カテゴリ

3,245

サブカテゴリ

39,334

用語

サブカテゴリ

Behavioral Cloning

専門家のデモンストレーションから直接行動を模倣する教師あり学習。

サブカテゴリ

逆強化学習

観察された専門家の行動から最適な報酬関数を推論する。

サブカテゴリ

生成的敵対的模倣学習

エージェントの行動と専門家の行動を区別するために敵対的ネットワークを使用します。

サブカテゴリ

Dataset Aggregation (DAgger)

エージェントの軌道上で専門家から新しいデータを収集し、ポリシーを改善する反復的な手法。

サブカテゴリ

人間のフィードバックからの報酬学習

人間が提供する比較的または質的な評価から報酬を学習する。

サブカテゴリ

オフライン強化学習

環境との相互作用なしに固定されたデータセットのみを使用する強化学習。

サブカテゴリ

モデルベース模倣学習

環境の動的モデルを構築し、模倣学習を加速させる。

サブカテゴリ

メタ模倣学習

わずかなデモンストレーションで新しいタスクを素早く模倣することを学ぶ。

サブカテゴリ

階層的模倣学習

複雑な行動を模倣しやすいサブタスクの階層に分解する。

サブカテゴリ

マルチモーダル模倣学習

同じタスクに対して複数の有効な解決策を扱い、行動の分布を学習する。

サブカテゴリ

自己模倣学習

エージェントは過去の成功した行動を模倣することで、現在の方策を改善します。

サブカテゴリ

目標条件付き模倣学習

特定の目標に基づいて様々なタスクを達成するためのポリシーを学習する。

サブカテゴリ

逆強化学習への敵対的アプローチ

より頑健な報酬推定のために、逆強化学習と敵対的学習を組み合わせる。

サブカテゴリ

部分観察における模倣学習

エージェントが状態の一部のみを観察する環境での模倣学習

サブカテゴリ

カリキュラム模倣学習

学習を促進するための難易度が段階的に増加するデモンストレーションの進行シーケンス。

🔍

結果が見つかりません