قاموس الذكاء الاصطناعي
القاموس الكامل للذكاء الاصطناعي
POMDP (عملية قرار ماركوفية قابلة للرصد الجزئي)
إطار رياضي رسمي لنمذجة البيئات التي يدرك فيها الوكيل فقط ملاحظة جزئية من الحالة الفعلية للنظام.
حالات الاعتقاد
التمثيل الاحتمالي للحالات الممكنة للنظام القائم على سجل الملاحظات وإجراءات الوكيل.
فلاتر الجسيمات
طريقة التقدير التسلسلي التي تستخدم عينات موزونة لتقريب توزيع الاعتقاد في POMDP
التعلم بالتعزيز جزئياً قابل للملاحظة
امتداد لخوارزمية التعلم بالتعزيز (Q-learning) مُكيّفة للبيئات التي لا تكون فيها الحالات الكاملة قابلة للملاحظة بشكل مباشر.
Réseaux de Neurones Récurrents pour POMDP
Architecture neuronale utilisant des mémoires internes pour maintenir l'information historique nécessaire à la prise de décision.
Exploration dans les POMDP
Stratégies d'exploration spécifiquement conçues pour gérer l'incertitude d'état dans les environnements partiellement observables.
التعلم بالتعزيز الهرمي لـِـ POMDP
نهج يقسم المشاكل المعقدة لـِـ POMDP إلى مهام فرعية هرمية لتحسين الكفاءة في التعلم
نماذج قائمة على الذاكرة
أنظمة تستخدم ذاكرة خارجية صريحة لتخزين واسترجاع المعلومات التاريخية ذات الصلة
Apprentissage Multi-agents Partiellement Observable
Extension du POMDP aux scénarios impliquant plusieurs agents interagissant dans un environnement partiellement observable.
تقريب السياسات لـ POMDP
طرق التقريب التي تسمح بحساب سياسات مثالية أو شبه مثالية في مساحات حالات الاعتقاد ذات الأبعاد الكبيرة.
Deep POMDP
Combination de l'apprentissage profond avec les POMDP pour gérer des environnements complexes et à haute dimensionnalité.
مُحَوِّلات لـ POMDP
تطبيق هياكل المحولات لنمذجة الاعتمادات الزمنية الطويلة في البيئات التي يتم مراقبتها جزئياً