集中型-分散型MARL
集中訓練と分散実行(CTDE)
MARLにおけるアーキテクチャパラダイムで、エージェントはグローバルで共有された情報を使用して訓練するが、完全に独立した分散的な方法で各自のポリシーを実行する。このアプローチは、集中訓練の効率性と分散実行の堅牢性を組み合わせる。
← 戻るMARLにおけるアーキテクチャパラダイムで、エージェントはグローバルで共有された情報を使用して訓練するが、完全に独立した分散的な方法で各自のポリシーを実行する。このアプローチは、集中訓練の効率性と分散実行の堅牢性を組み合わせる。
← 戻る