Внутренняя мотивация в HRL

📖

термины

Внутренняя Мотивация

Механизм автономного обучения, при котором агент генерирует внутренние вознаграждения на основе собственного любопытства или стремления к мастерству, независимо от внешних вознаграждений среды.

📖

термины

Внутреннее Вознаграждение

Сигнал вознаграждения, генерируемый самим агентом для поощрения исследования и изучения новых навыков, часто основанный на новизне, удивлении или прогрессе.

📖

термины

Обучение на Основе Любопытства

Подход к обучению, при котором агент мотивирован своим любопытством, измеряя ошибку предсказания своей модели мира для генерации внутренних вознаграждений за исследование.

📖

термины

Расширение Возможностей

Информационная мера, количественно определяющая контроль, который агент может осуществлять над своей средой, используемая как внутреннее вознаграждение для поощрения изучения влиятельных навыков.

📖

термины

Иерархическая Политика

Многоуровневая архитектура принятия решений, где политики высокого уровня выбирают опции или подзадачи, а политики низкого уровня выполняют соответствующие примитивные действия.

📖

термины

Модуль Внутренней Мотивации

Вычислительный компонент, предназначенный для расчета внутренних вознаграждений на основе различных метрик, таких как новизна, расширение возможностей или прогресс в освоении.

📖

термины

Дилемма Исследования-Использования

Фундаментальная проблема в обучении с подкреплением, заключающаяся в балансировании исследования новых возможностей и использования приобретенных знаний.

📖

термины

Мета-Обучение в HRL

Обучение механизмов автоматической адаптации иерархической структуры и внутренних мотиваций для оптимизации эффективности обучения на новых задачах.

📖

термины

Абстрактное представление состояния

Упрощенное представление состояния среды, фиксирующее основную информацию для иерархического принятия решений и обнаружения подцелей.

📖

термины

Генерация целей

Автономный процесс создания промежуточных целей на основе внутренней мотивации для управления исследованием и структурирования иерархического обучения.

📖

термины

Формирование внутреннего вознаграждения

Динамическое изменение функции вознаграждения путем добавления внутренних сигналов для ускорения сходимости и повышения эффективности обучения.

📖

термины

Автономная постановка целей

Способность агента определять собственные цели без внешнего вмешательства, используя механизмы внутренней мотивации для управления своим развитием.

📖

термины

Обнаружение иерархии

Автоматический процесс определения оптимальной иерархической структуры для решения задачи, основанный на анализе переходов состояний и внутренних вознаграждений.

Глоссарий ИИ