التعلم المعزز في الوقت الحقيقي
التعلم المعزز ذو الحلقة الصفرية
نهج حيث يتعلم العامل مباشرة من التفاعلات المستمرة دون تجزئة صريحة إلى حلقات. هذه الطريقة مناسبة بشكل خاص للأنظمة التي لا تحتوي على حدود طبيعية للحلقات.
← رجوع