التعلم بواسطة Dyna-Q
دينا-Q
خوارزمية هجينة للتعلم بالتعزيز تجمع بين التعلم المباشر من التجربة الحقيقية والتخطيط باستخدام نموذج متعلم لإنشاء تجارب محاكاة إضافية.
← رجوعخوارزمية هجينة للتعلم بالتعزيز تجمع بين التعلم المباشر من التجربة الحقيقية والتخطيط باستخدام نموذج متعلم لإنشاء تجارب محاكاة إضافية.
← رجوع