Глубокое Многоцелевое РЛ
Многокритериальный DQN
Архитектура Deep Q-Network, адаптированная для многокритериальных задач, использующая глубокие нейронные сети для аппроксимации векторных Q-функций. Сеть учится одновременно оценивать значения возврата для каждой цели, поддерживая согласованность компромиссов.
← Назад