التعلم بالتعزيز القائم على النموذج - مسرد الذكاء الاصطناعي

📂

الفئات الفرعية

التعلم بواسطة Dyna-Q

خوارزمية هجينة تجمع بين التعلم المباشر والتخطيط باستخدام نموذج مُتعلَم لتوليد تجارب محاكاة.

19 المصطلحات

📂

الفئات الفرعية

تخطيط شجرة البحث مونتي كارلو

خوارزمية استكشاف شجرة القرار التي تستخدم عمليات المحاكاة العشوائية لتقييم الإجراءات المستقبلية في بيئة نمذجية

19 المصطلحات

📂

الفئات الفرعية

التعلم بالخيال

تقنية تستخدم نماذج داخلية لمحاكاة سيناريوهات ذهنيًا وتسريع التعلم بدون تفاعل فعلي.

13 المصطلحات

📂

الفئات الفرعية

نماذج العالم

بنية تتعلم تمثيلاً مضغوطاً للبيئة ونموذجاً انتقالياً للتخطيط في الفضاء الكامن.

11 المصطلحات

📂

الفئات الفرعية

التعلم بالمجموعات النموذجية

نهج يستخدم نماذج متعلمة متعددة لكمية عدم اليقين وتحسين متانة القرارات.

14 المصطلحات

📂

الفئات الفرعية

التعلم بالتفاضل النموذجي

طريقة تقوم بتحسين السياسات بشكل مباشر عن طريق تمرير التدرجات من خلال نموذج قابل للتفاضل للبيئة.

11 المصطلحات

📂

الفئات الفرعية

التعلم بالفضول القائم على النموذج

نظام يستخدم أخطاء التنبؤ بالنموذج كإشارة داخلية لتوجيه استكشاف البيئة

12 المصطلحات

📂

الفئات الفرعية

التعلم بالتسلسل الهرمي القائم على النموذج

بنية متعددة المستويات تدمج نماذج على مختلف المقاييس الزمنية للتخطيط الفعال على آفاق طويلة

14 المصطلحات

📂

الفئات الفرعية

التعلم بالتنبؤ بالمسارات

نماذج تنبؤية تتعلم توقع تسلسلات الحالات المستقبلية لتقييم عواقب الإجراءات قبل التنفيذ.

15 المصطلحات

📂

الفئات الفرعية

التعلم بناءً على نموذج نقل التعلم

تقنية تنقل معرفة النموذج بين البيئات المتشابهة لتسريع التكيف مع المهام الجديدة.

13 المصطلحات

📂

الفئات الفرعية

مو زيرو

خوارزمية متقدمة تتعلم في نفس الوقت نموذجًا للانتقال والتفاعل والقيمة دون معرفة مسبقة بالديناميكيات.

13 المصطلحات

📂

الفئات الفرعية

التعلم بالتعلم النشط

استراتيجية تختار بفعالية التجارب الأكثر معلوماتية لتحسين كفاءة تعلم النموذج.

7 المصطلحات

قاموس الذكاء الاصطناعي

التعلم بواسطة Dyna-Q

تخطيط شجرة البحث مونتي كارلو

التعلم بالخيال

نماذج العالم

التعلم بالمجموعات النموذجية

التعلم بالتفاضل النموذجي

التعلم بالفضول القائم على النموذج

التعلم بالتسلسل الهرمي القائم على النموذج

التعلم بالتنبؤ بالمسارات

التعلم بناءً على نموذج نقل التعلم

مو زيرو

التعلم بالتعلم النشط

لم يتم العثور على نتائج