Внутренняя мотивация в HRL
Формирование внутреннего вознаграждения
Динамическое изменение функции вознаграждения путем добавления внутренних сигналов для ускорения сходимости и повышения эффективности обучения.
← Назад