Glossário IA
O dicionário completo da Inteligência Artificial
Convolução Dilatada (ou Atrous Convolution)
Operação de convolução que insere espaços entre os elementos do kernel, permitindo aumentar o campo receptivo sem aumentar o número de parâmetros nem a complexidade computacional.
Taxa de Dilatação (Dilation Rate)
Parâmetro das convoluções dilatadas que define o espaçamento entre os pixels do kernel de convolução, controlando diretamente o aumento do campo receptivo.
Encoder-Decoder com Atrous Convolution
Arquitetura do DeepLabv3+ que combina um codificador poderoso (ex: ResNet) com um decodificador simples e eficiente para refinar as previsões de segmentação, preservando os detalhes das bordas.
Fator de Redução de Resolução (Output Stride)
Relação entre a resolução da imagem de entrada e a dos mapas de características finais; DeepLab frequentemente usa um 'output stride' de 16 ou 8 para equilibrar precisão e velocidade.
Características de Nível de Imagem (Image-Level Features)
Características globais extraídas da imagem inteira, frequentemente via pooling global, e integradas no módulo ASPP do DeepLab para melhorar a classificação das classes de contexto.
DeepLabv1
Primeira versão do DeepLab que introduziu o uso de convoluções dilatadas em redes totalmente convolucionais (FCN) para segmentação semântica, aumentando o campo receptivo sem perda de resolução.
DeepLabv2
Versão do DeepLab que integrou o módulo Atrous Spatial Pyramid Pooling (ASPP) para capturar eficientemente o contexto multi-escala, tornando-se uma referência para a segmentação semântica.
DeepLabv3
Iteração que melhorou o módulo ASPP adicionando pooling global e convoluções 1x1, e explorou a aplicação de convoluções dilatadas em cascata para um melhor desempenho.
DeepLabv3+
Última versão principal que adiciona um decodificador simples, mas eficaz, à arquitetura do DeepLabv3, refinando as previsões de segmentação ao fundir características de baixo e alto nível.
Campo Aleatório Condicional Totalmente Conectado (CRF)
Método de pós-processamento utilizado nas primeiras versões do DeepLab para refinar as bordas das previsões de segmentação, modelando as relações entre todos os pixels da imagem.
Upsampling por Interpolação Bilinear
Técnica utilizada no DeepLab para restaurar a resolução espacial dos mapas de características após as convoluções dilatadas, a fim de produzir um mapa de segmentação do mesmo tamanho da imagem de entrada.
Agregação Contextual
Princípio fundamental do DeepLab que visa agregar informações contextuais de diferentes alcances espaciais através de convoluções dilatadas e do módulo ASPP para uma previsão mais robusta.