قاموس الذكاء الاصطناعي
القاموس الكامل للذكاء الاصطناعي
نماذج الديناميكا البيئية
تعلم النماذج الرياضية التي تصف كيف يتطور البيئة بناءً على إجراءات الوكيل.
التعلم بالتغليف (نماذج العالم)
بنية حيث يقوم الوكيل ببناء تمثيل داخلي للعالم لمحاكاة وتخطيط أفعاله المستقبلية.
تخطيط شجرة البحث مونتي كارلو
استخدام خوارزميات البحث في الشجرة مع النماذج المستفادة للعثور على السياسات المثلى.
النماذج الاحتمالية والبيزية
نهج دمج عدم اليقين في نمذجة البيئة لاتخاذ قرارات قوية
التعلم بالخيال والأحلام
تقنيات حيث يتدرب الوكيل على سيناريوهات محاكاة عقلية قبل التصرف في الواقع
النماذج التباينية
استخدام المشفرات التلقائية التباينية لتعلم التمثيلات الكامنة للبيئة.
التعلم بالنقل باستخدام النماذج
نقل المعرفة بين البيئات باستخدام نماذج متعلمة كوسائط.
النماذج الرسومية للتعلم المعزز
تمثيل البيئة على شكل رسوم بيانية لالتقاط العلاقات الهيكلية
التعلم بالتعزيز الهيراركي القائم على النماذج
التجزئة الهرمية للمهام مع نماذج بمستويات مختلفة من التجريد الزمني
نماذج مستمرة وقابلة للاشتقاق
نمذجة الديناميكيات المستمرة حيث يبقى النموذج قابلاً للاشتقاق للتحسين
معايرة عدم اليقين والاستكشاف
تقنيات لتحديد كمية وإدارة عدم اليقين في النموذج من أجل تحسين الاستكشاف.
التعلم المعزز العكسي القائم على النماذج
استدلال وظائف المكافأة باستخدام نماذج لتوليد مسارات معقولة