Глоссарий ИИ
Полный словарь искусственного интеллекта
Репараметризация (трюк репараметризации)
Техника, позволяющая дифференцировать процесс случайной выборки в VAE путем разложения случайной переменной на детерминированную часть и независимую стохастическую часть, что облегчает обратное распространение градиента.
Вариационная нижняя граница (ELBO)
Цель оптимизации VAE, эквивалентная логарифмической вероятности данных минус расхождение Кульбака-Лейблера, служащая в качестве управляемого прокси для максимизации вероятности наблюдаемых данных.
Модель латентной динамики
Модель, изучающая переходы состояний в латентном пространстве, предсказывающая следующее латентное представление из текущего латентного состояния и действия, снижающая сложность моделирования динамики окружающей среды.
Планирование в латентном пространстве
Стратегия, при которой агент ищет оптимальную последовательность действий, используя модель латентной динамики для симуляции будущих последствий без прямого взаимодействия с реальной средой.
Модель мира (World Model)
Архитектура, сочетающая VAE для восприятия, модель динамики (RNN или MDP) для предсказания латентных состояний и агент управления (policy), работающий полностью в этом симулируемом латентном пространстве.
Приближенное апостериорное распределение (q)
Распределение, параметризуемое кодирующей сетью, которое аппроксимирует истинное апостериорное распределение латентных переменных условно по наблюдениям, делая вывод управляемым.
Априорное распределение (p)
Распределение, выбранное для латентных переменных, как правило стандартное изотропическое гауссовское, служащее в качестве регуляризатора для структурирования латентного пространства и предотвращения переобучения.
Детерминистический против стохастического автоэнкодера
Различие, при котором детерминистический автоэнкодер отображает каждый вход в уникальную латентную точку, в то время как стохастический VAE отображает каждый вход в распределение, захватывая неопределенность и позволяя генерировать новые данные.
Коэффициент бета (β-VAE)
Гиперпараметр, взвешивающий член регуляризации KL в функции потерь ELBO, контролирующий компромисс между качеством восстановления и степенью разделения (disentanglement) латентных факторов.
Разъединение представлений (Disentanglement)
Свойство латентного пространства, где каждое измерение соответствует интерпретируемым образом независимому фактору семантической вариации в данных, улучшая обобщение и интерпретируемость модели.
Модель латентного перехода
Компонент модели мира, который предсказывает распределение следующего латентного состояния на основе текущего латентного состояния и примененного действия, формируя основу имитации (imagination) для планировщика.
Агент-контроллер (Controller)
Политика или нейронная сеть, принимающая решения о действиях, которая в рамках моделей мира обучается с использованием опыта, сгенерированного в латентном пространстве, а не из реальной среды.