قاموس الذكاء الاصطناعي
القاموس الكامل للذكاء الاصطناعي
التعلم المعزز متعدد الوكلاء
نمط تعلم حيث يتعلم عدة وكلاء في وقت واحد اتخاذ القرارات في بيئة مشتركة، ويتفاعلون مع بعضهم البعض لتحسين أهداف جماعية أو فردية.
متعدد الوكلاء - سياسة حتمية متدرجة عميقة (MADDPG)
خوارزمية CTDE تمتد بـ DDPG إلى بيئات متعددة الوكلاء، تستخدم نقاد مركزية وفاعلين لا مركزيين للتعلم في مسافات عمل مستمرة.
عملية قرار ماركوف جزئية الملاحظة متعددة الوكلاء (MPOMDP)
صياغة رياضية لبيئات MARL حيث يمتلك كل وكيل ملاحظات جزئية ويجب أن يستنتج الحالة العالمية لاتخاذ قرارات مثالية.
ألعاب المجال المتوسط
نظرية تدرس تفاعلات عدد كبير من الوكلاء العقلانيين بتقريب تأثير الحشد بمجال متوسط، قابلة للتطبيق على الأنظمة متعددة الوكلاء واسعة النطاق.
التحكم المستمر
مجال تطبيق MARL حيث يجب على الوكلاء التحكم في أنظمة فيزيائية بأفعال مستمرة، مثل الروبوتات المتحركة أو معالجة الأشياء.
الألعاب العشوائية
امتداد لـ MDP إلى بيئات متعددة الوكلاء حيث تعتمد التحولات والمكافآت على الأفعال المشتركة لجميع الوكلاء، ونمذجة سيناريوهات تعاونية وتنافسية.
توازن ناش في MARL
مفهوم الاستقرار حيث لا يمكن لأي وكيل تحسين مكافأته بتعديل استراتيجيته من جانب واحد، يستخدم كمعيار تقارب في خوارزميات MARL التنافسية.
بروتوكولات التنسيق
آليات اتصال أو تزامن تسمح للوكلاء بمحاذاة أفعالهم لتحقيق أهداف جماعية في بيئات MARL المستمرة.