Глоссарий ИИ
Полный словарь искусственного интеллекта
HRL на основе опций
Подход иерархического обучения с подкреплением, использующий опции как временные примитивы для структурирования политик в переиспользуемые подзадачи.
Обнаружение опций
Автоматический процесс идентификации и создания релевантных опций без явного контроля, основанный на структурных характеристиках среды.
Обнаружение опций на основе плотности
Метод, идентифицирующий опции в областях состояний с высокой плотностью, где агент проводит значительно больше времени, чем в других зонах.
Обнаружение опций на основе достижимости
Техника создания опций, основанная на способности эффективно достигать определенных целевых наборов состояний из различных начальных точек.
Обнаружение опций на основе узких мест
Подход, идентифицирующий опции в точках обязательного прохода или критических состояниях, которые соединяют различные области пространства состояний.
Внутриопционные политики
Политики, определяющие поведение агента во время выполнения опции, специфицирующие действия, которые следует предпринимать на каждом временном шаге.
Завершение опции
Механизм, определяющий, когда опция должна завершиться и вернуть управление политике верхнего уровня.
Целеориентированные опции
Опции, параметризованные специфическими целями, позволяющие гибкое переиспользование в различных контекстах задач.
Собственные опции
Опции, автоматически обнаруженные через разложение по собственным значениям матрицы переходов, захватывающие доминирующие режимы динамики.
Преемственные признаки
Прогнозирующие представления будущих появлений состояний, используемые для обнаружения переносимых опций между схожими задачами.
Частота посещения состояний
Статистическая мера, подсчитывающая, сколько раз каждое состояние посещается, служащая индикатором для идентификации релевантных регионов для обнаружения опций.
Состояния-бутылочные горлышки
Критические состояния, через которые агент должен пройти для достижения различных регионов пространства состояний, идеальные как точки завершения опций.
Графовое обнаружение опций
Метод, анализирующий структуру графа переходов состояний для идентификации релевантных путей и подграфов как кандидатов в опции.
Покрывающие опции
Набор опций, гарантирующий, что каждое состояние пространства может быть достигнуто по крайней мере одной опцией, обеспечивая полное покрытие.