Glosario IA
El diccionario completo de la Inteligencia Artificial
Modelo de Difusión Espacio-Temporal
Arquitectura de aprendizaje profundo que extiende los modelos de difusión 2D para capturar las dependencias espaciales y temporales, permitiendo la generación de secuencias de video coherentes cuadro por cuadro.
Eliminación de Ruido de Video por Difusión
Proceso iterativo donde un modelo de difusión aprende a invertir la adición de ruido gaussiano en secuencias de video, reconstruyendo así videos claros a partir de datos corruptos.
Latente Espacio-Temporal
Espacio de representación comprimido en un modelo de difusión de video, codificando simultáneamente las características espaciales y la evolución temporal para una generación eficiente.
Condicionamiento Temporal
Técnica que guía la generación de video inyectando información temporal (embeddings de tiempo, máscaras de movimiento) en el proceso de difusión para controlar el desarrollo de la acción.
Modelado Generativo Basado en Puntuación para Video
Paradigma donde el modelo aprende el gradiente de la distribución de probabilidad logarítmica de los datos de video (el score), utilizado para guiar el proceso de muestreo por difusión.
Tensor de Ruido Espacio-Temporal
Ruido gaussiano estructurado en 4D (tiempo, altura, ancho, canales) añadido progresivamente a los datos de video durante la fase de difusión hacia adelante del modelo.
Resolución Temporal por Difusión
Capacidad de un modelo de difusión de video para generar secuencias a altas tasas de fotogramas (fps) manteniendo la fluidez y la coherencia de los movimientos.
Guía sin Clasificador para Video
Método de control de la generación de video que utiliza un modelo único entrenado con y sin acondicionamiento (texto, imagen), permitiendo una guía precisa sin un clasificador externo.
U-Net 3D para Difusión de Vídeo
Arquitectura de red neuronal convolucional con conexiones residuales en 3D, específicamente adaptada para la eliminación de ruido de datos de vídeo en modelos de difusión.
Interpolación de Trayectorias Latentes
Técnica de generación de vídeo que consiste en interpolar entre puntos en el espacio latente para crear transiciones fluidas y lógicas entre diferentes estados o acciones.
Consistencia Temporal por Difusión
Objetivo de garantizar que los objetos y las escenas generadas mantengan su identidad y sus propiedades físicas a lo largo de los fotogramas sucesivos del vídeo.
Modelo de Difusión Vídeo-a-Vídeo (Video-to-Video)
Aplicación de modelos de difusión para transformar un vídeo de entrada en un vídeo de salida estilizado, modificado o mejorado, preservando la estructura temporal.
Programación de Difusión Temporal
Estrategia que define la varianza del ruido añadido en cada paso de tiempo del proceso de difusión de vídeo, influyendo en la calidad y la velocidad de generación.
Descomposición del Movimiento por Difusión
Método en el que el modelo de difusión aprende a separar y modelar independientemente el fondo estático y el movimiento de los objetos en una secuencia de vídeo.
Autoregresión en Difusión de Vídeo
Enfoque híbrido que combina la generación autorregresiva (el fotograma N+1 depende de N) con la eliminación de ruido por difusión para mejorar la coherencia a largo plazo.