التعلم بالتعزيز الهرمي متعدد الأهداف
Value Function Decomposition
تقنية تحلل دالة القيمة الشاملة إلى مساهمات كل مهمة فرعية وهدف، مما يسهل التعلم الموزع في الهياكل الهرمية.
← رجوعتقنية تحلل دالة القيمة الشاملة إلى مساهمات كل مهمة فرعية وهدف، مما يسهل التعلم الموزع في الهياكل الهرمية.
← رجوع