Generación de video con difusión

📖

términos

Modelo de Difusión Espacio-Temporal

Arquitectura de aprendizaje profundo que extiende los modelos de difusión 2D para capturar las dependencias espaciales y temporales, permitiendo la generación de secuencias de video coherentes cuadro por cuadro.

📖

términos

Eliminación de Ruido de Video por Difusión

Proceso iterativo donde un modelo de difusión aprende a invertir la adición de ruido gaussiano en secuencias de video, reconstruyendo así videos claros a partir de datos corruptos.

📖

términos

Latente Espacio-Temporal

Espacio de representación comprimido en un modelo de difusión de video, codificando simultáneamente las características espaciales y la evolución temporal para una generación eficiente.

📖

términos

Condicionamiento Temporal

Técnica que guía la generación de video inyectando información temporal (embeddings de tiempo, máscaras de movimiento) en el proceso de difusión para controlar el desarrollo de la acción.

📖

términos

Modelado Generativo Basado en Puntuación para Video

Paradigma donde el modelo aprende el gradiente de la distribución de probabilidad logarítmica de los datos de video (el score), utilizado para guiar el proceso de muestreo por difusión.

📖

términos

Tensor de Ruido Espacio-Temporal

Ruido gaussiano estructurado en 4D (tiempo, altura, ancho, canales) añadido progresivamente a los datos de video durante la fase de difusión hacia adelante del modelo.

📖

términos

Resolución Temporal por Difusión

Capacidad de un modelo de difusión de video para generar secuencias a altas tasas de fotogramas (fps) manteniendo la fluidez y la coherencia de los movimientos.

📖

términos

Guía sin Clasificador para Video

Método de control de la generación de video que utiliza un modelo único entrenado con y sin acondicionamiento (texto, imagen), permitiendo una guía precisa sin un clasificador externo.

📖

términos

U-Net 3D para Difusión de Vídeo

Arquitectura de red neuronal convolucional con conexiones residuales en 3D, específicamente adaptada para la eliminación de ruido de datos de vídeo en modelos de difusión.

📖

términos

Interpolación de Trayectorias Latentes

Técnica de generación de vídeo que consiste en interpolar entre puntos en el espacio latente para crear transiciones fluidas y lógicas entre diferentes estados o acciones.

📖

términos

Consistencia Temporal por Difusión

Objetivo de garantizar que los objetos y las escenas generadas mantengan su identidad y sus propiedades físicas a lo largo de los fotogramas sucesivos del vídeo.

📖

términos

Modelo de Difusión Vídeo-a-Vídeo (Video-to-Video)

Aplicación de modelos de difusión para transformar un vídeo de entrada en un vídeo de salida estilizado, modificado o mejorado, preservando la estructura temporal.

📖

términos

Programación de Difusión Temporal

Estrategia que define la varianza del ruido añadido en cada paso de tiempo del proceso de difusión de vídeo, influyendo en la calidad y la velocidad de generación.

📖

términos

Descomposición del Movimiento por Difusión

Método en el que el modelo de difusión aprende a separar y modelar independientemente el fondo estático y el movimiento de los objetos en una secuencia de vídeo.

📖

términos

Autoregresión en Difusión de Vídeo

Enfoque híbrido que combina la generación autorregresiva (el fotograma N+1 depende de N) con la eliminación de ruido por difusión para mejorar la coherencia a largo plazo.

Glosario IA

Modelo de Difusión Espacio-Temporal

Eliminación de Ruido de Video por Difusión

Latente Espacio-Temporal

Condicionamiento Temporal

Modelado Generativo Basado en Puntuación para Video

Tensor de Ruido Espacio-Temporal

Resolución Temporal por Difusión

Guía sin Clasificador para Video

U-Net 3D para Difusión de Vídeo

Interpolación de Trayectorias Latentes

Consistencia Temporal por Difusión

Modelo de Difusión Vídeo-a-Vídeo (Video-to-Video)

Programación de Difusión Temporal

Descomposición del Movimiento por Difusión

Autoregresión en Difusión de Vídeo

No se encontraron resultados