Glosario IA
El diccionario completo de la Inteligencia Artificial
Modelos de Difusión
Arquitectura generativa que utiliza un proceso progresivo de adición y eliminación de ruido para transformar los datos en ruido puro y luego reconstruir muestras realistas. Estos modelos sobresalen en la generación de imágenes de alta calidad con una estabilidad de entrenamiento superior a los GANs.
Proceso de Difusión Directa
Fase de entrenamiento donde el ruido gaussiano se agrega progresivamente a los datos originales a lo largo de varios pasos temporales para alcanzar una distribución de ruido puro. Este proceso de Markov está diseñado para ser reversible y matemáticamente predecible.
Proceso de Difusión Inversa
Fase de generación donde una red neuronal aprende a eliminar ruido progresivamente de una distribución de ruido puro para reconstruir datos coherentes. Este proceso está guiado por la estimación del gradiente de puntaje de la distribución de datos.
DDPM (Modelos de Difusión Probabilísticos de Eliminación de Ruido)
Clase fundamental de modelos de difusión introducida por Ho et al. en 2020, utilizando un calendario de varianza lineal y un objetivo de predicción de ruido. DDPM establece las bases matemáticas para las arquitecturas de difusión modernas.
Calendario de Ruido
Parametrización temporal que controla la cantidad de ruido agregado en cada etapa del proceso de difusión directa. Un calendario bien diseñado optimiza el equilibrio entre la preservación de la información y la eficiencia de eliminación de ruido.
Guía sin Clasificador
Técnica de control de generación que combina predicciones condicionales y no condicionales para mejorar la fidelidad al texto sin necesidad de un clasificador externo. Este método permite un control fino de la generación mientras preserva la diversidad.
Modelos de Difusión Latente
Arquitectura que optimiza los modelos de difusión trabajando en un espacio latente comprimido en lugar de directamente en el espacio de píxeles. Este enfoque reduce drásticamente los costos computacionales mientras mantiene una alta calidad de generación.
Muestreo Ancestral
Método de muestreo estocástico que combina eliminación de ruido determinista y adición controlada de ruido para mejorar la diversidad de las muestras generadas. Esta técnica equilibra calidad y creatividad en la generación.
Pasos de Difusión
Número discreto de pasos utilizados en el proceso de difusión, típicamente entre 100 y 1000 pasos para un equilibrio óptimo calidad-rendimiento. La selección de los pasos de tiempo influye directamente en la finura de los detalles generados.
U-Net de Reducción de Ruido
Arquitectura neuronal con conexiones residuales y atención, específicamente diseñada para predecir y eliminar el ruido en cada etapa de difusión. La estructura U-Net preserva eficazmente la información espacial mientras captura las dependencias globales.
Ecuaciones Diferenciales Estocásticas
Formulación matemática continua que unifica los procesos de difusión directa e inversa en un marco teórico riguroso. Este enfoque permite el análisis teórico y el desarrollo de nuevos algoritmos de muestreo.
Difusión Condicional
Extensión de los modelos de difusión que integra condiciones externas como texto, imágenes o clases para guiar la generación. Este enfoque permite un control preciso sobre las características de las muestras generadas.
Escala de Guía
Parámetro que controla la influencia de las condiciones en el proceso de generación, permitiendo ajustar el equilibrio entre fidelidad y creatividad. Una escala alta refuerza la adherencia a las instrucciones mientras que una escala baja favorece la diversidad.
Remuestreo Progresivo
Técnica de mejora iterativa que aplica múltiples ciclos de reducción de ruido para refinar los detalles y corregir artefactos. Este método optimiza la calidad final de las generaciones a costa de un tiempo de computación aumentado.
Autointeracción Cruzada
Mecanismo de atención que permite a los modelos de difusión fusionar eficazmente la información textual y visual durante la reducción de ruido. Esta arquitectura es crucial para la coherencia semántica en la generación de texto a imagen.
DDIM (Modelos Implícitos de Difusión de Reducción de Ruido)
Variante determinista de los modelos de difusión que permite un muestreo acelerado con menos pasos mientras preserva la calidad. DDIM transforma el proceso estocástico en un mapeo determinista no markoviano.