قاموس الذكاء الاصطناعي
القاموس الكامل للذكاء الاصطناعي
التعلم بواسطة Dyna-Q
خوارزمية هجينة تجمع بين التعلم المباشر والتخطيط باستخدام نموذج مُتعلَم لتوليد تجارب محاكاة.
تخطيط شجرة البحث مونتي كارلو
خوارزمية استكشاف شجرة القرار التي تستخدم عمليات المحاكاة العشوائية لتقييم الإجراءات المستقبلية في بيئة نمذجية
التعلم بالخيال
تقنية تستخدم نماذج داخلية لمحاكاة سيناريوهات ذهنيًا وتسريع التعلم بدون تفاعل فعلي.
نماذج العالم
بنية تتعلم تمثيلاً مضغوطاً للبيئة ونموذجاً انتقالياً للتخطيط في الفضاء الكامن.
التعلم بالمجموعات النموذجية
نهج يستخدم نماذج متعلمة متعددة لكمية عدم اليقين وتحسين متانة القرارات.
التعلم بالتفاضل النموذجي
طريقة تقوم بتحسين السياسات بشكل مباشر عن طريق تمرير التدرجات من خلال نموذج قابل للتفاضل للبيئة.
التعلم بالفضول القائم على النموذج
نظام يستخدم أخطاء التنبؤ بالنموذج كإشارة داخلية لتوجيه استكشاف البيئة
التعلم بالتسلسل الهرمي القائم على النموذج
بنية متعددة المستويات تدمج نماذج على مختلف المقاييس الزمنية للتخطيط الفعال على آفاق طويلة
التعلم بالتنبؤ بالمسارات
نماذج تنبؤية تتعلم توقع تسلسلات الحالات المستقبلية لتقييم عواقب الإجراءات قبل التنفيذ.
التعلم بناءً على نموذج نقل التعلم
تقنية تنقل معرفة النموذج بين البيئات المتشابهة لتسريع التكيف مع المهام الجديدة.
مو زيرو
خوارزمية متقدمة تتعلم في نفس الوقت نموذجًا للانتقال والتفاعل والقيمة دون معرفة مسبقة بالديناميكيات.
التعلم بالتعلم النشط
استراتيجية تختار بفعالية التجارب الأكثر معلوماتية لتحسين كفاءة تعلم النموذج.