🏠 ホーム
ベンチマーク
📊 すべてのベンチマーク 🦖 恐竜 v1 🦖 恐竜 v2 ✅ To-Doリストアプリ 🎨 クリエイティブフリーページ 🎯 FSACB - アルティメットショーケース 🌍 翻訳ベンチマーク
モデル
🏆 トップ10モデル 🆓 無料モデル 📋 すべてのモデル ⚙️ 🛠️ Kilo Code モード
リソース
💬 💬 プロンプトライブラリ 📖 📖 AI用語集 🔗 🔗 有用なリンク

AI用語集

人工知能の完全辞典

236
カテゴリ
3,245
サブカテゴリ
39,334
用語
📖
用語

マルチエージェント強化学習

複数のエージェントが共有環境内で同時に意思決定を学習するパラダイム。相互に相互作用しながら、集団的または個人的な目的を最適化する。

📖
用語

マルチエージェント深層決定論的政策勾配法(MADDPG)

DDPGをマルチエージェント環境に拡張したCTDEアルゴリズム。集中化された批評家と分散化された行動者を使用し、連続行動空間での学習を実現する。

📖
用語

マルチエージェント部分観測マルコフ決定過程(MPOMDP)

MARL環境の数学的形式化。各エージェントが部分的な観測を持ち、最適な意思決定を行うためにグローバル状態を推論する必要がある。

📖
用語

平均場ゲーム

多数の合理的エージェントの相互作用を研究する理論。群集効果を平均場で近似し、大規模マルチエージェントシステムに適用可能。

📖
用語

連続制御

MARLの応用分野。エージェントが移動ロボットや物体操作など、連続的な行動で物理システムを制御する必要がある領域。

📖
用語

確率ゲーム

MDPをマルチエージェント環境に拡張したもの。遷移と報酬が全エージェントの共同行動に依存し、協調的および競争的シナリオをモデル化する。

📖
用語

MARLにおけるナッシュ均衡

安定性の概念。どのエージェントも一方的に戦略を変更することで報酬を改善できない状態。競争的MARLアルゴリズムの収束基準として使用される。

📖
用語

協調プロトコル

通信または同期メカニズム。連続MARL環境において、エージェントが集団目標を達成するために行動を調整することを可能にする。

🔍

結果が見つかりません