Глоссарий ИИ
Полный словарь искусственного интеллекта
Внутренняя Мотивация
Механизм автономного обучения, при котором агент генерирует внутренние вознаграждения на основе собственного любопытства или стремления к мастерству, независимо от внешних вознаграждений среды.
Внутреннее Вознаграждение
Сигнал вознаграждения, генерируемый самим агентом для поощрения исследования и изучения новых навыков, часто основанный на новизне, удивлении или прогрессе.
Обучение на Основе Любопытства
Подход к обучению, при котором агент мотивирован своим любопытством, измеряя ошибку предсказания своей модели мира для генерации внутренних вознаграждений за исследование.
Расширение Возможностей
Информационная мера, количественно определяющая контроль, который агент может осуществлять над своей средой, используемая как внутреннее вознаграждение для поощрения изучения влиятельных навыков.
Иерархическая Политика
Многоуровневая архитектура принятия решений, где политики высокого уровня выбирают опции или подзадачи, а политики низкого уровня выполняют соответствующие примитивные действия.
Модуль Внутренней Мотивации
Вычислительный компонент, предназначенный для расчета внутренних вознаграждений на основе различных метрик, таких как новизна, расширение возможностей или прогресс в освоении.
Дилемма Исследования-Использования
Фундаментальная проблема в обучении с подкреплением, заключающаяся в балансировании исследования новых возможностей и использования приобретенных знаний.
Мета-Обучение в HRL
Обучение механизмов автоматической адаптации иерархической структуры и внутренних мотиваций для оптимизации эффективности обучения на новых задачах.
Абстрактное представление состояния
Упрощенное представление состояния среды, фиксирующее основную информацию для иерархического принятия решений и обнаружения подцелей.
Генерация целей
Автономный процесс создания промежуточных целей на основе внутренней мотивации для управления исследованием и структурирования иерархического обучения.
Формирование внутреннего вознаграждения
Динамическое изменение функции вознаграждения путем добавления внутренних сигналов для ускорения сходимости и повышения эффективности обучения.
Автономная постановка целей
Способность агента определять собственные цели без внешнего вмешательства, используя механизмы внутренней мотивации для управления своим развитием.
Обнаружение иерархии
Автоматический процесс определения оптимальной иерархической структуры для решения задачи, основанный на анализе переходов состояний и внутренних вознаграждений.