MARL الخصومي - مسرد الذكاء الاصطناعي

📖

المصطلحات

لعبة محصلتها صفر

سيناريو نظري حيث الربح الكلي لعامل ما يتوافق تمامًا مع خسارة عامل آخر، أساسي في التعلم المعزز متعدد العوامل العدائي لنمذجة المنافسات الصارمة.

📖

المصطلحات

خوارزمية مينيماكس

خوارزمية قرارية تزيد الربح الأدنى الممكن في المواقف العدائية، تُستخدم لتطوير استراتيجيات قوية ضد أسوأ إجراءات الخصم.

📖

المصطلحات

توازن ناش

حالة مستقرة حيث لا يمكن لأي عامل تحسين استراتيجيته بتغيير سلوكه من جانب واحد، حاسمة لتحليل نقاط التوازن في التعلم المعزز متعدد العوامل العدائي.

📖

المصطلحات

اللعب الذاتي

منهجية تدريب حيث يتعلم عامل ما بالمنافسة ضد نسخ من نفسه باستراتيجيات تطورية، مما يلغي الحاجة لبيانات خارجية.

📖

المصطلحات

سياسة قوية

سياسة تعلم معزز تحافظ على أداء عالٍ في مواجهة اضطرابات عدائية أو تغييرات غير متوقعة في البيئة.

📖

المصطلحات

تحسين أسوأ حالة

نموذج تحسين يهدف لزيادة الأداء في السيناريوهات الأكثر غير مواتية، أساسي لتطوير عوامل مرنة ضد الهجمات العدائية.

📖

المصطلحات

هجوم عدائي

إجراء متعمد لعامل ما يهدف لتدهور أداء عامل آخر عن طريق التلاعب بالبيئة أو حقن اضطرابات خبيثة.

📖

المصطلحات

استراتيجية دفاع

مجموعة من الآليات والسياسات المصممة للكشف عن الهجمات العدائية ومواجهتها والتعافي منها في الأنظمة متعددة العوامل.

📖

المصطلحات

البيئة الخصومة

بيئة تعلم مصممة لتقديم تحديات وعقبات بشكل نشط للوكلاء، محاكية ظروف حقيقية معادية أو غير متوقعة.

📖

المصطلحات

تقطير السياسة

تقنية لنقل المعرفة حيث يتم ضغط سياسة معقدة تعلمها وكيل إلى شكل أبسط وأكثر كفاءة، غالباً ما تستخدم بعد التدريب الخصومي.

📖

المصطلحات

التعلم المعزز الخصومي

نموذج تعلم معزز يدمج بشكل صريح وكلاء خصوم في عملية التدريب لتحسين المتانة وقدرات التعميم.

📖

المصطلحات

مشكلة قطاع الطرق متعدد الوكلاء الخصومي

امتداد لمشكلة قطاع الطرق حيث يتفاعل عدة وكلاء في بيئة مع مكافآت قد يتم التلاعب بها من قبل خصوم.

📖

المصطلحات

التعلم بالتقليد الخصومي

نهج للتعلم بالتقليد يستخدم مميزات خصومية لتقييم وتحسين جودة السلوك المقلد مقارنة بالخبراء.

📖

المصطلحات

اختبار المتانة

تقييم منهجي لأداء الوكلاء في مواجهة سيناريوهات متطرفة وهجمات منسقة لقياس مرونتهم وتحديد نقاط الضعف.

📖

المصطلحات

الاضطراب الخصومي

تعديل دقيق لكن متعمد للملاحظات أو البيئة مصمم لإحداث أخطاء في اتخاذ القرار لدى وكيل مستهدف.

📖

المصطلحات

عدم اليقين الاستراتيجي

عدم اليقين بشأن نوايا واستراتيجيات الخصوم المستقبلية، مما يتطلب نهجاً احتمالية وتكيفية في اتخاذ القرار متعدد الوكلاء.

📖

المصطلحات

نظرية الألعاب في التعلم المعزز متعدد العوامل

تطبيق نظرية الألعاب على التعلم المعزز متعدد العوامل لتحليل وتحسين السلوكيات الاستراتيجية في السياقات التنافسية.

قاموس الذكاء الاصطناعي

لعبة محصلتها صفر

خوارزمية مينيماكس

توازن ناش

اللعب الذاتي

سياسة قوية

تحسين أسوأ حالة

هجوم عدائي

استراتيجية دفاع

البيئة الخصومة

تقطير السياسة

التعلم المعزز الخصومي

مشكلة قطاع الطرق متعدد الوكلاء الخصومي

التعلم بالتقليد الخصومي

اختبار المتانة

الاضطراب الخصومي

عدم اليقين الاستراتيجي

نظرية الألعاب في التعلم المعزز متعدد العوامل

لم يتم العثور على نتائج