Segmentação por DeepLab

📖

termos

Convolução Dilatada (ou Atrous Convolution)

Operação de convolução que insere espaços entre os elementos do kernel, permitindo aumentar o campo receptivo sem aumentar o número de parâmetros nem a complexidade computacional.

📖

termos

Taxa de Dilatação (Dilation Rate)

Parâmetro das convoluções dilatadas que define o espaçamento entre os pixels do kernel de convolução, controlando diretamente o aumento do campo receptivo.

📖

termos

Encoder-Decoder com Atrous Convolution

Arquitetura do DeepLabv3+ que combina um codificador poderoso (ex: ResNet) com um decodificador simples e eficiente para refinar as previsões de segmentação, preservando os detalhes das bordas.

📖

termos

Fator de Redução de Resolução (Output Stride)

Relação entre a resolução da imagem de entrada e a dos mapas de características finais; DeepLab frequentemente usa um 'output stride' de 16 ou 8 para equilibrar precisão e velocidade.

📖

termos

Características de Nível de Imagem (Image-Level Features)

Características globais extraídas da imagem inteira, frequentemente via pooling global, e integradas no módulo ASPP do DeepLab para melhorar a classificação das classes de contexto.

📖

termos

DeepLabv1

Primeira versão do DeepLab que introduziu o uso de convoluções dilatadas em redes totalmente convolucionais (FCN) para segmentação semântica, aumentando o campo receptivo sem perda de resolução.

📖

termos

DeepLabv2

Versão do DeepLab que integrou o módulo Atrous Spatial Pyramid Pooling (ASPP) para capturar eficientemente o contexto multi-escala, tornando-se uma referência para a segmentação semântica.

📖

termos

DeepLabv3

Iteração que melhorou o módulo ASPP adicionando pooling global e convoluções 1x1, e explorou a aplicação de convoluções dilatadas em cascata para um melhor desempenho.

📖

termos

DeepLabv3+

Última versão principal que adiciona um decodificador simples, mas eficaz, à arquitetura do DeepLabv3, refinando as previsões de segmentação ao fundir características de baixo e alto nível.

📖

termos

Campo Aleatório Condicional Totalmente Conectado (CRF)

Método de pós-processamento utilizado nas primeiras versões do DeepLab para refinar as bordas das previsões de segmentação, modelando as relações entre todos os pixels da imagem.

📖

termos

Upsampling por Interpolação Bilinear

Técnica utilizada no DeepLab para restaurar a resolução espacial dos mapas de características após as convoluções dilatadas, a fim de produzir um mapa de segmentação do mesmo tamanho da imagem de entrada.

📖

termos

Agregação Contextual

Princípio fundamental do DeepLab que visa agregar informações contextuais de diferentes alcances espaciais através de convoluções dilatadas e do módulo ASPP para uma previsão mais robusta.

Glossário IA

Convolução Dilatada (ou Atrous Convolution)

Taxa de Dilatação (Dilation Rate)

Encoder-Decoder com Atrous Convolution

Fator de Redução de Resolução (Output Stride)

Características de Nível de Imagem (Image-Level Features)

DeepLabv1

DeepLabv2

DeepLabv3

DeepLabv3+

Campo Aleatório Condicional Totalmente Conectado (CRF)

Upsampling por Interpolação Bilinear

Agregação Contextual

Nenhum resultado encontrado