Глоссарий ИИ
Полный словарь искусственного интеллекта
Инференс с управляемым шумоподавлением
Процесс инференса в диффузионных моделях, где пошаговое шумоподавление направляется внешней информацией (например, исходным изображением), чтобы гарантировать, что конечный результат соответствует заданным ограничениям.
Кодирование семантической структуры
Техника, направленная на захват и представление пространственной композиции и отношений между объектами исходного изображения, часто с помощью карт контуров, глубины или сегментации, для управления генерацией.
Анцестральная выборка (Ancestral Sampling)
Стохастический метод выборки при шумоподавлении, который добавляет на каждом шаге количество шума, унаследованное от предыдущего шага, чтобы ввести вариативность и избежать слишком детерминированных результатов.
Латентное вложение (Latent Embedding)
Векторное представление исходного изображения в пространстве низкой размерности, генерируемое кодировщиком (например, VAE), которое используется как условие в латентном пространстве диффузионной модели для эффективного перевода изображение-в-изображение.
Шумоподавление по счёту Ланжевена
Итеративный алгоритм оптимизации, использующий градиент логарифмической плотности вероятности (счёт) для постепенного уточнения зашумлённого образца в сторону целевого распределения данных, лежащий в основе выборки в диффузионных моделях.
Карта перекрёстного внимания
Механизм в трансформерах, который позволяет модели генерировать изображение, динамически взвешивая важность различных частей условия (например, токенов текста или патчей исходного изображения) на каждом этапе генерации.
Латентный диффузионный конвейер (LDM)
Архитектура диффузионной модели, которая полностью работает в сжатом латентном пространстве, полученном с помощью VAE, для снижения вычислительной сложности при сохранении высокого качества генерации изображений.
Prompt-to-Prompt
Метод редактирования изображений с помощью диффузии, который позволяет изменять сгенерированное изображение путём модификации его исходного текстового промпта, сохраняя при этом структуру оригинального изображения благодаря выравниванию карт внимания.
Plug-and-Play (PnP) Диффузия
Парадигма решения обратных задач (например: шумоподавление, суперразрешение), которая использует предварительно обученную модель диффузии в качестве априорной информации об изображениях, комбинируя её с моделью данных, специфичной для задачи, без переобучения диффузионной модели.