Планирование в условиях стохастической неопределенности
Приблизительное динамическое программирование (ADP)
Набор методов для решения задач оптимального управления большой размерности с использованием аппроксимаций функции ценности. Оно существенно для MDP с непрерывными пространствами состояний.
← Назад