Модельное обучение на основе любопытства
Граница любопытства
Механизм или теоретическое ограничение, направленное на ограничение любопытства агента, чтобы направить его на аспекты окружающей среды, которые одновременно неизвестны и контролируемы/изучаемы. Это помогает смягчить проблему случайного телевизора.
← Назад