🏠 الرئيسية
المقاييس
📊 جميع المقاييس 🦖 ديناصور v1 🦖 ديناصور v2 ✅ تطبيقات قائمة المهام 🎨 صفحات حرة إبداعية 🎯 FSACB - العرض النهائي 🌍 مقياس الترجمة
النماذج
🏆 أفضل 10 نماذج 🆓 نماذج مجانية 📋 جميع النماذج ⚙️ كيلو كود
الموارد
💬 مكتبة الأوامر 📖 قاموس الذكاء الاصطناعي 🔗 روابط مفيدة
📖
المركزي-اللامركزي في التعلم متعدد العوامل

متعدد العوامل متدرج السياسة الحتمية العميق (MADDPG)

امتداد لـ DDPG في بيئات متعددة العوامل باستخدام التعلم المركزي-اللامركزي مع نقاد مركزية وفاعلين لا مركزيين. يتعلم كل وكيل سياسة مع اعتبار سياسات الوكلاء الآخرين كجزء من البيئة.

← رجوع