Glosario IA
El diccionario completo de la Inteligencia Artificial
Inferencia de Desenruido Guiada
Proceso de inferencia en los modelos de difusión donde el desenruido progresivo es orientado por una información externa (ej: imagen fuente) para asegurar que el resultado final respete las restricciones impuestas.
Codificación de Estructura Semántica
Técnica que busca capturar y representar la composición espacial y las relaciones entre los objetos de una imagen fuente, a menudo mediante mapas de contornos, de profundidad o de segmentación, para guiar la generación.
Muestreo Ancestral (Ancestral Sampling)
Método de muestreo estocástico durante el desenruido que añade una cantidad de ruido en cada etapa, heredada de la etapa anterior, para introducir variabilidad y evitar resultados demasiado deterministas.
Incrustación Latente (Latent Embedding)
Representación vectorial de baja dimensión de una imagen fuente, generada por un codificador (ej: VAE), que se utiliza como condición en el espacio latente de un modelo de difusión para una traducción de imagen a imagen eficiente.
Desenruido de Puntuación de Langevin
Algoritmo de optimización iterativo que utiliza el gradiente de la log-densidad de probabilidad (la puntuación) para refinar progresivamente una muestra ruidosa hacia una distribución de datos objetivo, formando la base del muestreo de los modelos de difusión.
Mapa de Atención Cruzada
Mecanismo en los transformadores que permite al modelo generar una imagen ponderando dinámicamente la importancia de diferentes partes de la condición (ej: tokens de texto o parches de una imagen fuente) en cada etapa de la generación.
Pipeline de Difusión Latente (LDM)
Arquitectura de modelo de difusión que opera completamente en un espacio latente comprimido, obtenido mediante un VAE, para reducir la complejidad computacional manteniendo una alta calidad de generación de imágenes.
Prompt-to-Prompt
Método de edición de imágenes por difusión que permite modificar una imagen generada cambiando su prompt de texto inicial, preservando la estructura de la imagen original gracias a una alineación de los mapas de atención.
Difusión Plug-and-Play (PnP)
Paradigma de resolución de problemas inversos (por ejemplo: eliminación de ruido, superresolución) que utiliza un modelo de difusión preentrenado como un a priori en las imágenes, combinándolo con un modelo de datos específico para la tarea sin reentrenar el difusor.