🏠 الرئيسية
المقاييس
📊 جميع المقاييس 🦖 ديناصور v1 🦖 ديناصور v2 ✅ تطبيقات قائمة المهام 🎨 صفحات حرة إبداعية 🎯 FSACB - العرض النهائي 🌍 مقياس الترجمة
النماذج
🏆 أفضل 10 نماذج 🆓 نماذج مجانية 📋 جميع النماذج ⚙️ كيلو كود
الموارد
💬 مكتبة الأوامر 📖 قاموس الذكاء الاصطناعي 🔗 روابط مفيدة

قاموس الذكاء الاصطناعي

القاموس الكامل للذكاء الاصطناعي

227
الفئات
2,955
الفئات الفرعية
34,512
المصطلحات
📖
المصطلحات

MARL (التعلم بالتعزيز متعدد الوكلاء)

نموذج تعلم حيث تتفاعل عدة وكلاء في وقت واحد في بيئة مشتركة، ويتعلمون سياسات مثلى بشكل فردي أو جماعي.

📖
المصطلحات

التدريب المركزي مع التنفيذ اللامركزي (CTDE)

نهج حيث يتدرب الوكلاء باستخدام معلومات عالمية مركزية ولكنهم ينفذون سياساتهم بشكل لامركزي مع ملاحظات محلية.

📖
المصطلحات

QMIX (خلط قيمة Q)

خوارزمية تفكيك قيمة Q التي تمثل قيمة Q المشتركة كتركيبة غير خطية رتيبة من قيم Q الفردية للوكلاء.

📖
المصطلحات

VDN (شبكات تفكيك القيمة)

طريقة تحليل للقيمة الإجمالية التي تفكك القيمة المشتركة إلى مجموع القيم الفردية لكل وكيل في إطار تعاوني.

📖
المصطلحات

MADDPG (تدرج السياسة الحتمية العميقة متعددة الوكلاء)

امتداد لـ DDPG للبيئات متعددة الوكلاء باستخدام التعلم المركزي مع التنفيذ اللامركزي للبيئات المختلطة.

📖
المصطلحات

COMA (تدرجات السياسة متعددة الوكلاء بعكسية)

خوارزمية تستخدم قواعد عكسية لتقدير كيف تؤثر الإجراءات الفردية على المكافأة العالمية عن طريق تغيير سياسة وكيل واحد مع الحفاظ على الآخرين ثابتة.

📖
المصطلحات

Dec-POMDP (عملية القرار الماركوفية القابلة للرصد جزئياً اللامركزية)

صياغة رياضية لمشاكل القرار التسلسلي متعددة الوكلاء مع رصد جزئي واتخاذ قرارات لامركزي.

📖
المصطلحات

تخصيص الائتمان

مشكلة أساسية تتعلق بتحديد مساهمة كل وكيل في المكافأة الجماعية في البيئات متعددة الوكلاء التعاونية.

📖
المصطلحات

Joint Action Learning

تقنية يتعلم فيها الوكلاء تنسيق إجراءاتهم من خلال مراعاة الإجراءات المتزامنة لجميع الوكلاء في البيئة.

📖
المصطلحات

Agent Modeling

قدرة الوكيل على بناء والحفاظ على نماذج عقلية لنوايا ومعتقدات وسياسات الوكلاء الآخرين في البيئة.

📖
المصطلحات

Mean Field Theory in MARL

نهج نظري يتعامل مع التفاعلات متعددة الوكلاء على نطاق واسع من خلال تقريب التأثير الجماعي بحقل متوسط إحصائي.

📖
المصطلحات

Opponent Modeling

عملية تعلم استراتيجيات وسلوكيات الوكلاء الخصوم من أجل التنبؤ بإجراءاتهم وتحسين سياستهم الخاصة في الألعاب التنافسية.

📖
المصطلحات

Communication Protocols in MARL

آليات تسمح للوكلاء بتبادل المعلومات لتحسين التنسيق والكفاءة الجماعية في المهام التعاونية.

📖
المصطلحات

Cooperative MARL

مجال فرعي من التعلم المعزز متعدد الوكلاء حيث يشارك الوكلاء هدفًا مشتركًا ويزيدون من المكافأة الجماعية من خلال التنسيق والتعاون.

📖
المصطلحات

Competitive MARL

إطار متعدد الوكلاء حيث يتنافس الأفراد أو الفرق في ألعاب ذات مجموع صفرية أو غير صفرية لزيادة مكافآتهم الفردية.

📖
المصطلحات

Mixed-Motive MARL

بيئات متعددة الوكلاء تجمع بين عناصر تعاونية وتنافسية، حيث يجب على الوكلاء الموازنة بين المصالح الشخصية والأهداف الجماعية.

📖
المصطلحات

السلوك الناشئ

سلوكيات معقدة غير مبرمجة تظهر بشكل تلقائي من التفاعل بين الوكلاء المتعلمين في بيئة مشتركة.

📖
المصطلحات

آليات الانتباه في التعلم المعزز متعدد الوكلاء

تقنيات تسمح للوكلاء بوزن المعلومات بشكل انتقائي القادمة من وكلاء آخرين أو أجزاء من البيئة لاتخاذ قرار أفضل.

📖
المصطلحات

التعلم المنهجي في التعلم المعزز متعدد الوكلاء

استراتيجية تدريبية تتقدم من المهام البسيطة إلى المعقدة لتسهيل تعلم السياسات القوية في البيئات متعددة الوكلاء.

📖
المصطلحات

قابلية التوسع في التعلم المعزز متعدد الوكلاء

تحدٍ خوارزمي يتمثل في الحفاظ على أداء التعلم مواجهةً للزيادة الأسية لمساحة العمل المشتركة مع عدد الوكلاء.

🔍

لم يتم العثور على نتائج