Диффузия Видео и Временная

📖

термины

Модель Диффузии Видео

Архитектура генерации, которая применяет процесс диффузии к пространственно-временным данным, постепенно добавляя шум к изображениям видеопоследовательности перед обучением его удалению для восстановления или создания согласованных видео.

📖

термины

Пространственно-Временная Латентная Диффузия

Вариант моделей видеодиффузии, работающий в сжатом латентном пространстве, снижающий вычислительную сложность путем применения процесса добавления и удаления шума к низкоразмерным представлениям вместо сырых пикселей каждого кадра.

📖

термины

3D Внимание

Механизм внимания, который одновременно обрабатывает пространственные (высота, ширина) и временные (время) измерения видео, позволяя модели взвешивать важность различных регионов в разные моменты времени для захвата пространственно-временных зависимостей.

📖

термины

Внедрение Времени (Time Embedding)

Техника кодирования временной информации (шаг диффузии, позиция в последовательности) в виде векторов, которые внедряются в сеть, направляя процесс генерации для поддержания согласованности и движения во времени.

📖

термины

Условное Удаление Шума по Предыдущему Кадру

Стратегия, где предсказание шума для видеокадра обусловлено очищенной версией предыдущего кадра, обеспечивая сильную непрерывность и временную согласованность между последовательными изображениями генерируемой последовательности.

📖

термины

3D U-Net Архитектура

Структура сверточной нейронной сети, адаптированная для видеоданных, сочетающая пути энкодер-декодер с 3D остаточными соединениями для эффективного захвата контекстов на множественных пространственных и временных масштабах при удалении шума.

📖

термины

Пространственно-Временное Латентное Пространство

Сжатое и абстрактное представление видеопоследовательности, где пространственная и временная информация закодирована в вектор или карту признаков низкой размерности, служащую основой для генерации или манипуляции видео.

📖

термины

Бесклассовый Направляющий Контроль (CFG) для Видео

Метод управления генерацией видео без явного классификатора, обучая модель одновременно на условных (например, текст) и безусловных данных, затем интерполируя между их предсказаниями для настройки соответствия промпту при сохранении разнообразия.

📖

термины

Временное планирование диффузии

Планирование количества шагов денойзинга, выделяемых для каждого кадра или временных сегментов, которое может быть равномерным или адаптивным для оптимизации качества и общей согласованности генерируемого видео в зависимости от сложности движения.

📖

термины

Временная супер-разрешение с помощью диффузии

Применение моделей диффузии для увеличения частоты кадров (fps) видео, генерируя промежуточные кадры, которые реалистично интерполируют движение и изменения между существующими кадрами.

📖

термины

Видео инпейнтинг с помощью диффузии

Процесс заполнения отсутствующих или замаскированных областей в видео последовательности с использованием модели диффузии, которая генерирует пиксели, пространственно и временно согласованные на основе контекста окружающих кадров.

📖

термины

Моделирование латентного движения

Техника, при которой движение в видео моделируется и генерируется непосредственно в латентном пространстве, часто путем предсказания смещений или преобразований между латентными кодами последовательных кадров перед их декодированием в изображения.

📖

термины

Временная согласованность через ограничения

Подход, который добавляет штраф или явное ограничение в функцию потерь модели, чтобы предотвратить изменения внешнего вида (например, цвета, текстуры), не связанные с движением между соседними кадрами, способствуя визуальной стабильности.

📖

термины

Пространственно-временная декомпозиция шума

Продвинутый метод, при котором шум, добавляемый и предсказываемый моделью, декомпозируется на пространственную компоненту (внешний вид) и временную компоненту (движение), позволяя более точный контроль и более надежную генерацию динамических видео.

📖

термины

Авторегрессия на латентных представлениях диффузии

Гибридная стратегия, которая генерирует видео авторегрессивно кадр за кадром, где каждый латентный кадр производится шагом диффузии, обусловленным предыдущими латентными кадрами, сочетая согласованность авторегрессии и качество диффузии.

📖

термины

Нормализация временных характеристик

Слой нормализации, применяемый к временному измерению карт признаков в 3D U-Net, стабилизирующий обучение, обеспечивая согласованность распределения активаций на различных временных этапах последовательности.

Глоссарий ИИ

Модель Диффузии Видео

Пространственно-Временная Латентная Диффузия

3D Внимание

Внедрение Времени (Time Embedding)

Условное Удаление Шума по Предыдущему Кадру

3D U-Net Архитектура

Пространственно-Временное Латентное Пространство

Бесклассовый Направляющий Контроль (CFG) для Видео

Временное планирование диффузии

Временная супер-разрешение с помощью диффузии

Видео инпейнтинг с помощью диффузии

Моделирование латентного движения

Временная согласованность через ограничения

Пространственно-временная декомпозиция шума

Авторегрессия на латентных представлениях диффузии

Нормализация временных характеристик

Результаты не найдены