التعلم المعميق بالتعزيز متعدد الوكلاء

📖

المصطلحات

MARL (التعلم بالتعزيز متعدد الوكلاء)

نموذج تعلم حيث تتفاعل عدة وكلاء في وقت واحد في بيئة مشتركة، ويتعلمون سياسات مثلى بشكل فردي أو جماعي.

📖

المصطلحات

التدريب المركزي مع التنفيذ اللامركزي (CTDE)

نهج حيث يتدرب الوكلاء باستخدام معلومات عالمية مركزية ولكنهم ينفذون سياساتهم بشكل لامركزي مع ملاحظات محلية.

📖

المصطلحات

QMIX (خلط قيمة Q)

خوارزمية تفكيك قيمة Q التي تمثل قيمة Q المشتركة كتركيبة غير خطية رتيبة من قيم Q الفردية للوكلاء.

📖

المصطلحات

VDN (شبكات تفكيك القيمة)

طريقة تحليل للقيمة الإجمالية التي تفكك القيمة المشتركة إلى مجموع القيم الفردية لكل وكيل في إطار تعاوني.

📖

المصطلحات

MADDPG (تدرج السياسة الحتمية العميقة متعددة الوكلاء)

امتداد لـ DDPG للبيئات متعددة الوكلاء باستخدام التعلم المركزي مع التنفيذ اللامركزي للبيئات المختلطة.

📖

المصطلحات

COMA (تدرجات السياسة متعددة الوكلاء بعكسية)

خوارزمية تستخدم قواعد عكسية لتقدير كيف تؤثر الإجراءات الفردية على المكافأة العالمية عن طريق تغيير سياسة وكيل واحد مع الحفاظ على الآخرين ثابتة.

📖

المصطلحات

Dec-POMDP (عملية القرار الماركوفية القابلة للرصد جزئياً اللامركزية)

صياغة رياضية لمشاكل القرار التسلسلي متعددة الوكلاء مع رصد جزئي واتخاذ قرارات لامركزي.

📖

المصطلحات

تخصيص الائتمان

مشكلة أساسية تتعلق بتحديد مساهمة كل وكيل في المكافأة الجماعية في البيئات متعددة الوكلاء التعاونية.

📖

المصطلحات

Joint Action Learning

تقنية يتعلم فيها الوكلاء تنسيق إجراءاتهم من خلال مراعاة الإجراءات المتزامنة لجميع الوكلاء في البيئة.

📖

المصطلحات

Agent Modeling

قدرة الوكيل على بناء والحفاظ على نماذج عقلية لنوايا ومعتقدات وسياسات الوكلاء الآخرين في البيئة.

📖

المصطلحات

Mean Field Theory in MARL

نهج نظري يتعامل مع التفاعلات متعددة الوكلاء على نطاق واسع من خلال تقريب التأثير الجماعي بحقل متوسط إحصائي.

📖

المصطلحات

Opponent Modeling

عملية تعلم استراتيجيات وسلوكيات الوكلاء الخصوم من أجل التنبؤ بإجراءاتهم وتحسين سياستهم الخاصة في الألعاب التنافسية.

📖

المصطلحات

Communication Protocols in MARL

آليات تسمح للوكلاء بتبادل المعلومات لتحسين التنسيق والكفاءة الجماعية في المهام التعاونية.

📖

المصطلحات

Cooperative MARL

مجال فرعي من التعلم المعزز متعدد الوكلاء حيث يشارك الوكلاء هدفًا مشتركًا ويزيدون من المكافأة الجماعية من خلال التنسيق والتعاون.

📖

المصطلحات

Competitive MARL

إطار متعدد الوكلاء حيث يتنافس الأفراد أو الفرق في ألعاب ذات مجموع صفرية أو غير صفرية لزيادة مكافآتهم الفردية.

📖

المصطلحات

Mixed-Motive MARL

بيئات متعددة الوكلاء تجمع بين عناصر تعاونية وتنافسية، حيث يجب على الوكلاء الموازنة بين المصالح الشخصية والأهداف الجماعية.

📖

المصطلحات

السلوك الناشئ

سلوكيات معقدة غير مبرمجة تظهر بشكل تلقائي من التفاعل بين الوكلاء المتعلمين في بيئة مشتركة.

📖

المصطلحات

آليات الانتباه في التعلم المعزز متعدد الوكلاء

تقنيات تسمح للوكلاء بوزن المعلومات بشكل انتقائي القادمة من وكلاء آخرين أو أجزاء من البيئة لاتخاذ قرار أفضل.

📖

المصطلحات

التعلم المنهجي في التعلم المعزز متعدد الوكلاء

استراتيجية تدريبية تتقدم من المهام البسيطة إلى المعقدة لتسهيل تعلم السياسات القوية في البيئات متعددة الوكلاء.

📖

المصطلحات

قابلية التوسع في التعلم المعزز متعدد الوكلاء

تحدٍ خوارزمي يتمثل في الحفاظ على أداء التعلم مواجهةً للزيادة الأسية لمساحة العمل المشتركة مع عدد الوكلاء.

قاموس الذكاء الاصطناعي

MARL (التعلم بالتعزيز متعدد الوكلاء)

التدريب المركزي مع التنفيذ اللامركزي (CTDE)

QMIX (خلط قيمة Q)

VDN (شبكات تفكيك القيمة)

MADDPG (تدرج السياسة الحتمية العميقة متعددة الوكلاء)

COMA (تدرجات السياسة متعددة الوكلاء بعكسية)

Dec-POMDP (عملية القرار الماركوفية القابلة للرصد جزئياً اللامركزية)

تخصيص الائتمان

Joint Action Learning

Agent Modeling

Mean Field Theory in MARL

Opponent Modeling

Communication Protocols in MARL

Cooperative MARL

Competitive MARL

Mixed-Motive MARL

السلوك الناشئ

آليات الانتباه في التعلم المعزز متعدد الوكلاء

التعلم المنهجي في التعلم المعزز متعدد الوكلاء

قابلية التوسع في التعلم المعزز متعدد الوكلاء

لم يتم العثور على نتائج