التعلم بواسطة Dyna-Q
تعميم النموذج
القدرة على استقراء تنبؤات النموذج لحالات-إجراءات غير ملاحظة، غالباً ما تتم من خلال الشبكات العصبية أو مُقَرِّبات الوظائف الأخرى.
← رجوعالقدرة على استقراء تنبؤات النموذج لحالات-إجراءات غير ملاحظة، غالباً ما تتم من خلال الشبكات العصبية أو مُقَرِّبات الوظائف الأخرى.
← رجوع