قاموس الذكاء الاصطناعي
القاموس الكامل للذكاء الاصطناعي
الحالة الاعتقادية (Belief State)
توزيع احتمالي على مجموعة الحالات الممكنة، يمثل تقدير الوكيل للحالة الحالية للنظام مع مراعاة سجل الملاحظات والإجراءات.
دالة الملاحظة
نموذج احتمالي يحدد احتمالية ملاحظة معلومة معينة مع العلم بالحالة الفعلية للنظام والإجراء الذي قام به الوكيل.
فضاء الملاحظات
مجموعة كل الملاحظات الممكنة التي يمكن للوكيل تلقيها من البيئة، والتي قد تكون أقل إفادة من الحالة الفعلية.
تحديث الاعتقاد
عملية، غالبًا ما تستند إلى فلتر بايز، يقوم من خلالها الوكيل بتحديث توزيع الاعتقاد بعد تنفيذ إجراء وتلقي ملاحظة جديدة.
سياسة الاعتقاد
استراتيجية ترسم خريطة لكل حالة اعتقاد ممكنة إلى إجراء يجب اتخاذه، مع تحسين توقعات المكافآت المتراكمة على المدى الطويل.
الأفق
عدد الخطوات التي يخطط لها الوكيل، والتي يمكن أن تكون محدودة (حلقة) أو غير محدودة، مما يؤثر على كيفية تحديث المكافآت المستقبلية.
شجرة التخطيط
هيكل بيانات شجري يستكشف التسلسلات الممكنة للإجراءات والملاحظات لتقييم واختيار أفضل سياسة في POMDP.
تكرار القيمة النقطي لـ POMDP (POMDP-PI)
خوارزمية تكرار على القيمة تحسب وظائف القيمة المثلى لـ POMDPs عن طريق تمثيل وظيفة القيمة كمجموعة من متجهات ألفا.
Vecteurs Alpha (Alpha Vectors)
Les hyperplans qui composent la fonction de valeur dans un POMDP, où chaque vecteur est associé à une action et définit une région de l'espace des croyances où cette action est optimale.
Q-MDP
Une méthode d'approximation pour résoudre les POMDPs qui suppose que la valeur d'une action dans un état de croyance est la valeur Q de l'action dans l'état le plus probable de cette croyance.
Factored POMDP
Une représentation de POMDP où l'espace d'états et d'observations est structuré à l'aide de variables aléatoires, permettant de modéliser des dépendances et de réduire la complexité.
DEC-POMDP
Acronyme de Decentralized Partially Observable Markov Decision Process, une extension du POMDP à plusieurs agents qui prennent des décisions de manière décentralisée sans communication directe.
Rétropropagation de la valeur (Value Backup)
L'opération fondamentale dans les algorithmes de POMDP qui met à jour la valeur d'un nœud de croyance en considérant les valeurs des nœuds enfants résultant des actions et observations possibles.