التعلم العميق بالتعزيز متعدد الأهداف
DQN متعدد الأهداف
بنية Deep Q-Network مكيفة للمشاكل متعددة الأهداف تستخدم الشبكات العصبية العميقة لتقريب دوال Q-المتجهة. الشبكة تتعلم تقدير قيم العائد لكل هدف في نفس الوقت مع الحفاظ على اتساق الموازنات.
← رجوع