Segmentación por DeepLab

📖

términos

Convolución Dilatada (o Convolución Atrous)

Operación de convolución que inserta espacios entre los elementos del núcleo, permitiendo aumentar el campo receptivo sin incrementar el número de parámetros ni la complejidad computacional.

📖

términos

Tasa de Dilatación (Dilation Rate)

Parámetro de las convoluciones dilatadas que define el espaciado entre los píxeles del núcleo de convolución, controlando directamente el aumento del campo receptivo.

📖

términos

Codificador-Decodificador con Convolución Atrous

Arquitectura de DeepLabv3+ que combina un codificador potente (ej: ResNet) con un decodificador simple y eficiente para refinar las predicciones de segmentación mientras preserva los detalles de los bordes.

📖

términos

Factor de Reducción de Resolución (Output Stride)

Relación entre la resolución de la imagen de entrada y la de los mapas de características finales; DeepLab utiliza frecuentemente un 'output stride' de 16 u 8 para equilibrar precisión y velocidad.

📖

términos

Características a Nivel de Imagen (Image-Level Features)

Características globales extraídas de la imagen completa, frecuentemente mediante pooling global, e integradas en el módulo ASPP de DeepLab para mejorar la clasificación de las clases de contexto.

📖

términos

DeepLabv1

Primera versión de DeepLab que introdujo el uso de convoluciones dilatadas en redes completamente convolucionales (FCN) para la segmentación semántica, aumentando el campo receptivo sin pérdida de resolución.

📖

términos

DeepLabv2

Versión de DeepLab que integró el módulo Atrous Spatial Pyramid Pooling (ASPP) para capturar eficientemente el contexto multi-escala, convirtiéndose en una referencia para la segmentación semántica.

📖

términos

DeepLabv3

Iteración que mejoró el módulo ASPP añadiendo pooling global y convoluciones 1x1, y exploró la aplicación de convoluciones dilatadas en cascada para un mejor rendimiento.

📖

términos

DeepLabv3+

Última versión principal que añade un decodificador simple pero eficaz a la arquitectura de DeepLabv3, refinando las predicciones de segmentación fusionando características de bajo nivel y alto nivel.

📖

términos

Fully Connected Conditional Random Field (CRF)

Método de postprocesamiento utilizado en las primeras versiones de DeepLab para refinar los bordes de las predicciones de segmentación modelando las relaciones entre todos los píxeles de la imagen.

📖

términos

Upsampling por Bilinear Interpolation

Técnica utilizada en DeepLab para restaurar la resolución espacial de los mapas de características después de las convoluciones dilatadas, con el fin de producir un mapa de segmentación del mismo tamaño que la imagen de entrada.

📖

términos

Contextual Aggregation

Principio fundamental de DeepLab que busca agregar información contextual de diferentes alcances espaciales mediante convoluciones dilatadas y el módulo ASPP para una predicción más robusta.

Glosario IA

Convolución Dilatada (o Convolución Atrous)

Tasa de Dilatación (Dilation Rate)

Codificador-Decodificador con Convolución Atrous

Factor de Reducción de Resolución (Output Stride)

Características a Nivel de Imagen (Image-Level Features)

DeepLabv1

DeepLabv2

DeepLabv3

DeepLabv3+

Fully Connected Conditional Random Field (CRF)

Upsampling por Bilinear Interpolation

Contextual Aggregation

No se encontraron resultados