Glosario IA
El diccionario completo de la Inteligencia Artificial
Convolución Dilatada (o Convolución Atrous)
Operación de convolución que inserta espacios entre los elementos del núcleo, permitiendo aumentar el campo receptivo sin incrementar el número de parámetros ni la complejidad computacional.
Tasa de Dilatación (Dilation Rate)
Parámetro de las convoluciones dilatadas que define el espaciado entre los píxeles del núcleo de convolución, controlando directamente el aumento del campo receptivo.
Codificador-Decodificador con Convolución Atrous
Arquitectura de DeepLabv3+ que combina un codificador potente (ej: ResNet) con un decodificador simple y eficiente para refinar las predicciones de segmentación mientras preserva los detalles de los bordes.
Factor de Reducción de Resolución (Output Stride)
Relación entre la resolución de la imagen de entrada y la de los mapas de características finales; DeepLab utiliza frecuentemente un 'output stride' de 16 u 8 para equilibrar precisión y velocidad.
Características a Nivel de Imagen (Image-Level Features)
Características globales extraídas de la imagen completa, frecuentemente mediante pooling global, e integradas en el módulo ASPP de DeepLab para mejorar la clasificación de las clases de contexto.
DeepLabv1
Primera versión de DeepLab que introdujo el uso de convoluciones dilatadas en redes completamente convolucionales (FCN) para la segmentación semántica, aumentando el campo receptivo sin pérdida de resolución.
DeepLabv2
Versión de DeepLab que integró el módulo Atrous Spatial Pyramid Pooling (ASPP) para capturar eficientemente el contexto multi-escala, convirtiéndose en una referencia para la segmentación semántica.
DeepLabv3
Iteración que mejoró el módulo ASPP añadiendo pooling global y convoluciones 1x1, y exploró la aplicación de convoluciones dilatadas en cascada para un mejor rendimiento.
DeepLabv3+
Última versión principal que añade un decodificador simple pero eficaz a la arquitectura de DeepLabv3, refinando las predicciones de segmentación fusionando características de bajo nivel y alto nivel.
Fully Connected Conditional Random Field (CRF)
Método de postprocesamiento utilizado en las primeras versiones de DeepLab para refinar los bordes de las predicciones de segmentación modelando las relaciones entre todos los píxeles de la imagen.
Upsampling por Bilinear Interpolation
Técnica utilizada en DeepLab para restaurar la resolución espacial de los mapas de características después de las convoluciones dilatadas, con el fin de producir un mapa de segmentación del mismo tamaño que la imagen de entrada.
Contextual Aggregation
Principio fundamental de DeepLab que busca agregar información contextual de diferentes alcances espaciales mediante convoluciones dilatadas y el módulo ASPP para una predicción más robusta.