قاموس الذكاء الاصطناعي

القاموس الكامل للذكاء الاصطناعي

227

الفئات

2,955

الفئات الفرعية

34,512

المصطلحات

📖

المصطلحات

التعلم المعزز متعدد الوكلاء

نمط تعلم حيث يتعلم عدة وكلاء في وقت واحد اتخاذ القرارات في بيئة مشتركة، ويتفاعلون مع بعضهم البعض لتحسين أهداف جماعية أو فردية.

📖

المصطلحات

متعدد الوكلاء - سياسة حتمية متدرجة عميقة (MADDPG)

خوارزمية CTDE تمتد بـ DDPG إلى بيئات متعددة الوكلاء، تستخدم نقاد مركزية وفاعلين لا مركزيين للتعلم في مسافات عمل مستمرة.

📖

المصطلحات

عملية قرار ماركوف جزئية الملاحظة متعددة الوكلاء (MPOMDP)

صياغة رياضية لبيئات MARL حيث يمتلك كل وكيل ملاحظات جزئية ويجب أن يستنتج الحالة العالمية لاتخاذ قرارات مثالية.

📖

المصطلحات

ألعاب المجال المتوسط

نظرية تدرس تفاعلات عدد كبير من الوكلاء العقلانيين بتقريب تأثير الحشد بمجال متوسط، قابلة للتطبيق على الأنظمة متعددة الوكلاء واسعة النطاق.

📖

المصطلحات

التحكم المستمر

مجال تطبيق MARL حيث يجب على الوكلاء التحكم في أنظمة فيزيائية بأفعال مستمرة، مثل الروبوتات المتحركة أو معالجة الأشياء.

📖

المصطلحات

الألعاب العشوائية

امتداد لـ MDP إلى بيئات متعددة الوكلاء حيث تعتمد التحولات والمكافآت على الأفعال المشتركة لجميع الوكلاء، ونمذجة سيناريوهات تعاونية وتنافسية.

📖

المصطلحات

توازن ناش في MARL

مفهوم الاستقرار حيث لا يمكن لأي وكيل تحسين مكافأته بتعديل استراتيجيته من جانب واحد، يستخدم كمعيار تقارب في خوارزميات MARL التنافسية.

📖

المصطلحات

بروتوكولات التنسيق

آليات اتصال أو تزامن تسمح للوكلاء بمحاذاة أفعالهم لتحقيق أهداف جماعية في بيئات MARL المستمرة.

🔍

قاموس الذكاء الاصطناعي

التعلم المعزز متعدد الوكلاء

متعدد الوكلاء - سياسة حتمية متدرجة عميقة (MADDPG)

عملية قرار ماركوف جزئية الملاحظة متعددة الوكلاء (MPOMDP)

ألعاب المجال المتوسط

التحكم المستمر

الألعاب العشوائية

توازن ناش في MARL

بروتوكولات التنسيق

لم يتم العثور على نتائج