قاموس الذكاء الاصطناعي
القاموس الكامل للذكاء الاصطناعي
MARL (التعلم بالتعزيز متعدد الوكلاء)
نموذج تعلم حيث تتفاعل عدة وكلاء في وقت واحد في بيئة مشتركة، ويتعلمون سياسات مثلى بشكل فردي أو جماعي.
التدريب المركزي مع التنفيذ اللامركزي (CTDE)
نهج حيث يتدرب الوكلاء باستخدام معلومات عالمية مركزية ولكنهم ينفذون سياساتهم بشكل لامركزي مع ملاحظات محلية.
QMIX (خلط قيمة Q)
خوارزمية تفكيك قيمة Q التي تمثل قيمة Q المشتركة كتركيبة غير خطية رتيبة من قيم Q الفردية للوكلاء.
VDN (شبكات تفكيك القيمة)
طريقة تحليل للقيمة الإجمالية التي تفكك القيمة المشتركة إلى مجموع القيم الفردية لكل وكيل في إطار تعاوني.
MADDPG (تدرج السياسة الحتمية العميقة متعددة الوكلاء)
امتداد لـ DDPG للبيئات متعددة الوكلاء باستخدام التعلم المركزي مع التنفيذ اللامركزي للبيئات المختلطة.
COMA (تدرجات السياسة متعددة الوكلاء بعكسية)
خوارزمية تستخدم قواعد عكسية لتقدير كيف تؤثر الإجراءات الفردية على المكافأة العالمية عن طريق تغيير سياسة وكيل واحد مع الحفاظ على الآخرين ثابتة.
Dec-POMDP (عملية القرار الماركوفية القابلة للرصد جزئياً اللامركزية)
صياغة رياضية لمشاكل القرار التسلسلي متعددة الوكلاء مع رصد جزئي واتخاذ قرارات لامركزي.
تخصيص الائتمان
مشكلة أساسية تتعلق بتحديد مساهمة كل وكيل في المكافأة الجماعية في البيئات متعددة الوكلاء التعاونية.
Joint Action Learning
تقنية يتعلم فيها الوكلاء تنسيق إجراءاتهم من خلال مراعاة الإجراءات المتزامنة لجميع الوكلاء في البيئة.
Agent Modeling
قدرة الوكيل على بناء والحفاظ على نماذج عقلية لنوايا ومعتقدات وسياسات الوكلاء الآخرين في البيئة.
Mean Field Theory in MARL
نهج نظري يتعامل مع التفاعلات متعددة الوكلاء على نطاق واسع من خلال تقريب التأثير الجماعي بحقل متوسط إحصائي.
Opponent Modeling
عملية تعلم استراتيجيات وسلوكيات الوكلاء الخصوم من أجل التنبؤ بإجراءاتهم وتحسين سياستهم الخاصة في الألعاب التنافسية.
Communication Protocols in MARL
آليات تسمح للوكلاء بتبادل المعلومات لتحسين التنسيق والكفاءة الجماعية في المهام التعاونية.
Cooperative MARL
مجال فرعي من التعلم المعزز متعدد الوكلاء حيث يشارك الوكلاء هدفًا مشتركًا ويزيدون من المكافأة الجماعية من خلال التنسيق والتعاون.
Competitive MARL
إطار متعدد الوكلاء حيث يتنافس الأفراد أو الفرق في ألعاب ذات مجموع صفرية أو غير صفرية لزيادة مكافآتهم الفردية.
Mixed-Motive MARL
بيئات متعددة الوكلاء تجمع بين عناصر تعاونية وتنافسية، حيث يجب على الوكلاء الموازنة بين المصالح الشخصية والأهداف الجماعية.
السلوك الناشئ
سلوكيات معقدة غير مبرمجة تظهر بشكل تلقائي من التفاعل بين الوكلاء المتعلمين في بيئة مشتركة.
آليات الانتباه في التعلم المعزز متعدد الوكلاء
تقنيات تسمح للوكلاء بوزن المعلومات بشكل انتقائي القادمة من وكلاء آخرين أو أجزاء من البيئة لاتخاذ قرار أفضل.
التعلم المنهجي في التعلم المعزز متعدد الوكلاء
استراتيجية تدريبية تتقدم من المهام البسيطة إلى المعقدة لتسهيل تعلم السياسات القوية في البيئات متعددة الوكلاء.
قابلية التوسع في التعلم المعزز متعدد الوكلاء
تحدٍ خوارزمي يتمثل في الحفاظ على أداء التعلم مواجهةً للزيادة الأسية لمساحة العمل المشتركة مع عدد الوكلاء.