قاموس الذكاء الاصطناعي
القاموس الكامل للذكاء الاصطناعي
التنبؤ بالمسار متعدد الخطوات
تقنية تتضمن توقع سلسلة مستمرة من الحالات المستقبلية على عدة خطوات زمنية لتقييم العواقب طويلة الأمد لإجراء قبل تنفيذه الفعلي.
شجرة بحث مونت كارلو
خوارزمية استكشاف شجرية تستخدم محاكاة عشوائية لتقييم المسارات المستقبلية المحتملة من حالة معينة، محسّنة اختيار الإجراءات.
التخطيط بالتوقع
عملية تقييم متسلسل للإجراءات المستقبلية باستخدام النموذج المكتسب لاختيار السياسة المثلى قبل أي تفاعل مع البيئة الحقيقية.
نموذج ديناميكية البيئة
شبكة عصبية مدربة على التقاط القواعد الفيزيائية وتغيرات حالة البيئة للتنبؤ بدقة عواقب إجراءات الوكيل.
خيال النموذج
قدرة النظام على توليد سيناريوهات ومسارات بديلة عقلياً باستخدام نموذجه الداخلي للبيئة بدون تفاعل مادي.
محاكاة التوقع
محاكاة كاملة لتسلسل إجراءات من حالة أولية باستخدام النموذج المكتسب لتقييم المكافأة التراكمية المتوقعة.
التعلم بالتجربة الافتراضية
باراديغم حيث يحسن الوكيل أداءه بشكل أساسي من خلال التجارب المحاكاة في نموذجه الداخلي بدلاً من التفاعلات المباشرة مع البيئة.
نموذج توليدي للمسارات
بنية تعلم عميق تولد توزيعات مسارات محتملة بدلاً من التنبؤ الحتمي، ملتقطة الطبيعة العشوائية للبيئة.
استكشاف بالمحاكاة
استراتيجية استكشاف حيث يكتشف الوكيل سياسات جديدة من خلال محاكاة سيناريوهات بشكل مكثف في نموذجه قبل اختبار الأكثر وعدًا في الواقع.
التنبؤ بالحالة والفعل
نموذج يتنبأ مباشرة بالحالة التالية s(t+1) بناءً على الحالة الحالية s(t) والفعل a(t)، مكونًا معادلة الانتقال الأساسية.
مخزن التجربة الخيالية
هيكل بيانات يخزن المسارات المحاكاة التي تم إنشاؤها بواسطة النموذج للتدريب، مكملًا التجربة الحقيقية التي تم جمعها في البيئة.
تعلم النموذج العالمي
نهج حيث يتعلم نموذج فريد الديناميكيات الكاملة للبيئة، مشترك بين جميع المهام والسياسات لتعميم أفضل.
شبكة التنبؤ بالمسار
بنية عصبية متخصصة في التنبؤ بتسلسلات الحالات المستقبلية، غالبًا ما تستند إلى RNN أو محولات لالتقاط التبعيات الزمنية.
التحقق من النموذج
عملية منهجية لتقييم دقة التنبؤ بالنموذج على البيانات المحجوزة لضمان موثوقية المسارات المحاكاة.
توليد الحالات المضادة
تقنية تنشئ مسارات بديلة افتراضية لفهم تأثير القرارات المختلفة وتحسين الفهم السببي للنموذج.