🏠 الرئيسية
المقاييس
📊 جميع المقاييس 🦖 ديناصور v1 🦖 ديناصور v2 ✅ تطبيقات قائمة المهام 🎨 صفحات حرة إبداعية 🎯 FSACB - العرض النهائي 🌍 مقياس الترجمة
النماذج
🏆 أفضل 10 نماذج 🆓 نماذج مجانية 📋 جميع النماذج ⚙️ كيلو كود
الموارد
💬 مكتبة الأوامر 📖 قاموس الذكاء الاصطناعي 🔗 روابط مفيدة

قاموس الذكاء الاصطناعي

القاموس الكامل للذكاء الاصطناعي

227
الفئات
2,955
الفئات الفرعية
34,512
المصطلحات
📖
المصطلحات

التعلم المعزز متعدد الوكلاء

نمط تعلم حيث يتعلم عدة وكلاء في وقت واحد اتخاذ القرارات في بيئة مشتركة، ويتفاعلون مع بعضهم البعض لتحسين أهداف جماعية أو فردية.

📖
المصطلحات

متعدد الوكلاء - سياسة حتمية متدرجة عميقة (MADDPG)

خوارزمية CTDE تمتد بـ DDPG إلى بيئات متعددة الوكلاء، تستخدم نقاد مركزية وفاعلين لا مركزيين للتعلم في مسافات عمل مستمرة.

📖
المصطلحات

عملية قرار ماركوف جزئية الملاحظة متعددة الوكلاء (MPOMDP)

صياغة رياضية لبيئات MARL حيث يمتلك كل وكيل ملاحظات جزئية ويجب أن يستنتج الحالة العالمية لاتخاذ قرارات مثالية.

📖
المصطلحات

ألعاب المجال المتوسط

نظرية تدرس تفاعلات عدد كبير من الوكلاء العقلانيين بتقريب تأثير الحشد بمجال متوسط، قابلة للتطبيق على الأنظمة متعددة الوكلاء واسعة النطاق.

📖
المصطلحات

التحكم المستمر

مجال تطبيق MARL حيث يجب على الوكلاء التحكم في أنظمة فيزيائية بأفعال مستمرة، مثل الروبوتات المتحركة أو معالجة الأشياء.

📖
المصطلحات

الألعاب العشوائية

امتداد لـ MDP إلى بيئات متعددة الوكلاء حيث تعتمد التحولات والمكافآت على الأفعال المشتركة لجميع الوكلاء، ونمذجة سيناريوهات تعاونية وتنافسية.

📖
المصطلحات

توازن ناش في MARL

مفهوم الاستقرار حيث لا يمكن لأي وكيل تحسين مكافأته بتعديل استراتيجيته من جانب واحد، يستخدم كمعيار تقارب في خوارزميات MARL التنافسية.

📖
المصطلحات

بروتوكولات التنسيق

آليات اتصال أو تزامن تسمح للوكلاء بمحاذاة أفعالهم لتحقيق أهداف جماعية في بيئات MARL المستمرة.

🔍

لم يتم العثور على نتائج