Вариационные модели - Глоссарий ИИ

📖

термины

Репараметризация (трюк репараметризации)

Техника, позволяющая дифференцировать процесс случайной выборки в VAE путем разложения случайной переменной на детерминированную часть и независимую стохастическую часть, что облегчает обратное распространение градиента.

📖

термины

Вариационная нижняя граница (ELBO)

Цель оптимизации VAE, эквивалентная логарифмической вероятности данных минус расхождение Кульбака-Лейблера, служащая в качестве управляемого прокси для максимизации вероятности наблюдаемых данных.

📖

термины

Модель латентной динамики

Модель, изучающая переходы состояний в латентном пространстве, предсказывающая следующее латентное представление из текущего латентного состояния и действия, снижающая сложность моделирования динамики окружающей среды.

📖

термины

Планирование в латентном пространстве

Стратегия, при которой агент ищет оптимальную последовательность действий, используя модель латентной динамики для симуляции будущих последствий без прямого взаимодействия с реальной средой.

📖

термины

Модель мира (World Model)

Архитектура, сочетающая VAE для восприятия, модель динамики (RNN или MDP) для предсказания латентных состояний и агент управления (policy), работающий полностью в этом симулируемом латентном пространстве.

📖

термины

Приближенное апостериорное распределение (q)

Распределение, параметризуемое кодирующей сетью, которое аппроксимирует истинное апостериорное распределение латентных переменных условно по наблюдениям, делая вывод управляемым.

📖

термины

Априорное распределение (p)

Распределение, выбранное для латентных переменных, как правило стандартное изотропическое гауссовское, служащее в качестве регуляризатора для структурирования латентного пространства и предотвращения переобучения.

📖

термины

Детерминистический против стохастического автоэнкодера

Различие, при котором детерминистический автоэнкодер отображает каждый вход в уникальную латентную точку, в то время как стохастический VAE отображает каждый вход в распределение, захватывая неопределенность и позволяя генерировать новые данные.

📖

термины

Коэффициент бета (β-VAE)

Гиперпараметр, взвешивающий член регуляризации KL в функции потерь ELBO, контролирующий компромисс между качеством восстановления и степенью разделения (disentanglement) латентных факторов.

📖

термины

Разъединение представлений (Disentanglement)

Свойство латентного пространства, где каждое измерение соответствует интерпретируемым образом независимому фактору семантической вариации в данных, улучшая обобщение и интерпретируемость модели.

📖

термины

Модель латентного перехода

Компонент модели мира, который предсказывает распределение следующего латентного состояния на основе текущего латентного состояния и примененного действия, формируя основу имитации (imagination) для планировщика.

📖

термины

Агент-контроллер (Controller)

Политика или нейронная сеть, принимающая решения о действиях, которая в рамках моделей мира обучается с использованием опыта, сгенерированного в латентном пространстве, а не из реальной среды.

Глоссарий ИИ

Репараметризация (трюк репараметризации)

Вариационная нижняя граница (ELBO)

Модель латентной динамики

Планирование в латентном пространстве

Модель мира (World Model)

Приближенное апостериорное распределение (q)

Априорное распределение (p)

Детерминистический против стохастического автоэнкодера

Коэффициент бета (β-VAE)

Разъединение представлений (Disentanglement)

Модель латентного перехода

Агент-контроллер (Controller)

Результаты не найдены