MARL Continu - AI用語集

📖

用語

複数のエージェントが共有環境内で同時に意思決定を学習するパラダイム。相互に相互作用しながら、集団的または個人的な目的を最適化する。

📖

用語

DDPGをマルチエージェント環境に拡張したCTDEアルゴリズム。集中化された批評家と分散化された行動者を使用し、連続行動空間での学習を実現する。

📖

用語

MARL環境の数学的形式化。各エージェントが部分的な観測を持ち、最適な意思決定を行うためにグローバル状態を推論する必要がある。

📖

用語

多数の合理的エージェントの相互作用を研究する理論。群集効果を平均場で近似し、大規模マルチエージェントシステムに適用可能。

📖

用語

MARLの応用分野。エージェントが移動ロボットや物体操作など、連続的な行動で物理システムを制御する必要がある領域。

📖

用語

MDPをマルチエージェント環境に拡張したもの。遷移と報酬が全エージェントの共同行動に依存し、協調的および競争的シナリオをモデル化する。

📖

用語

安定性の概念。どのエージェントも一方的に戦略を変更することで報酬を改善できない状態。競争的MARLアルゴリズムの収束基準として使用される。

📖

用語

通信または同期メカニズム。連続MARL環境において、エージェントが集団目標を達成するために行動を調整することを可能にする。

AI用語集