🏠 Accueil
Benchmarks
📊 Tous les Benchmarks 🦖 Dinosaure v1 🦖 Dinosaure v2 ✅ To-Do List Apps 🎨 Pages Libres 🎯 FSACB - Showcase 🌍 Traduction
Modèles
🏆 Top 10 Modèles 🆓 Modèles Gratuits 📋 Tous les Modèles ⚙️ Modes Kilo Code
Ressources
💬 Prompts IA 📖 Glossaire IA 🔗 Liens Utiles
📖
Multi-Agent Deep RL

COMA (Counterfactual Multi-Agent Policy Gradients)

Algorithme qui utilise des bases contrefactuelles pour estimer comment les actions individuelles affectent la récompense globale en modifiant la politique d'un agent tout en maintenant les autres fixes.

← Retour