Планирование с помощью обучения с подкреплением
Формирование вознаграждения (Reward Shaping)
Техника разработки вознаграждений, которая изменяет исходную функцию вознаграждения для более эффективного направления агента к желаемым поведенческим моделям планирования.
← Назад