قاموس الذكاء الاصطناعي
القاموس الكامل للذكاء الاصطناعي
لعبة محصلتها صفر
سيناريو نظري حيث الربح الكلي لعامل ما يتوافق تمامًا مع خسارة عامل آخر، أساسي في التعلم المعزز متعدد العوامل العدائي لنمذجة المنافسات الصارمة.
خوارزمية مينيماكس
خوارزمية قرارية تزيد الربح الأدنى الممكن في المواقف العدائية، تُستخدم لتطوير استراتيجيات قوية ضد أسوأ إجراءات الخصم.
توازن ناش
حالة مستقرة حيث لا يمكن لأي عامل تحسين استراتيجيته بتغيير سلوكه من جانب واحد، حاسمة لتحليل نقاط التوازن في التعلم المعزز متعدد العوامل العدائي.
اللعب الذاتي
منهجية تدريب حيث يتعلم عامل ما بالمنافسة ضد نسخ من نفسه باستراتيجيات تطورية، مما يلغي الحاجة لبيانات خارجية.
سياسة قوية
سياسة تعلم معزز تحافظ على أداء عالٍ في مواجهة اضطرابات عدائية أو تغييرات غير متوقعة في البيئة.
تحسين أسوأ حالة
نموذج تحسين يهدف لزيادة الأداء في السيناريوهات الأكثر غير مواتية، أساسي لتطوير عوامل مرنة ضد الهجمات العدائية.
هجوم عدائي
إجراء متعمد لعامل ما يهدف لتدهور أداء عامل آخر عن طريق التلاعب بالبيئة أو حقن اضطرابات خبيثة.
استراتيجية دفاع
مجموعة من الآليات والسياسات المصممة للكشف عن الهجمات العدائية ومواجهتها والتعافي منها في الأنظمة متعددة العوامل.
البيئة الخصومة
بيئة تعلم مصممة لتقديم تحديات وعقبات بشكل نشط للوكلاء، محاكية ظروف حقيقية معادية أو غير متوقعة.
تقطير السياسة
تقنية لنقل المعرفة حيث يتم ضغط سياسة معقدة تعلمها وكيل إلى شكل أبسط وأكثر كفاءة، غالباً ما تستخدم بعد التدريب الخصومي.
التعلم المعزز الخصومي
نموذج تعلم معزز يدمج بشكل صريح وكلاء خصوم في عملية التدريب لتحسين المتانة وقدرات التعميم.
مشكلة قطاع الطرق متعدد الوكلاء الخصومي
امتداد لمشكلة قطاع الطرق حيث يتفاعل عدة وكلاء في بيئة مع مكافآت قد يتم التلاعب بها من قبل خصوم.
التعلم بالتقليد الخصومي
نهج للتعلم بالتقليد يستخدم مميزات خصومية لتقييم وتحسين جودة السلوك المقلد مقارنة بالخبراء.
اختبار المتانة
تقييم منهجي لأداء الوكلاء في مواجهة سيناريوهات متطرفة وهجمات منسقة لقياس مرونتهم وتحديد نقاط الضعف.
الاضطراب الخصومي
تعديل دقيق لكن متعمد للملاحظات أو البيئة مصمم لإحداث أخطاء في اتخاذ القرار لدى وكيل مستهدف.
عدم اليقين الاستراتيجي
عدم اليقين بشأن نوايا واستراتيجيات الخصوم المستقبلية، مما يتطلب نهجاً احتمالية وتكيفية في اتخاذ القرار متعدد الوكلاء.
نظرية الألعاب في التعلم المعزز متعدد العوامل
تطبيق نظرية الألعاب على التعلم المعزز متعدد العوامل لتحليل وتحسين السلوكيات الاستراتيجية في السياقات التنافسية.