Glosario IA
El diccionario completo de la Inteligencia Artificial
Red Convolucional Completa (FCN)
Arquitectura de red neuronal convolucional que reemplaza las capas completamente conectadas por capas convolucionales para generar mapas de segmentación del mismo tamaño que la imagen de entrada.
DeepLab
Familia de modelos de segmentación semántica que utilizan convoluciones dilatadas (atrous) para aumentar el campo de recepción sin perder resolución espacial.
Convolución Atrous (Convolución Dilatada)
Operación de convolución que inserta espacios entre los píxeles del núcleo para aumentar el campo de recepción y capturar el contexto a mayor escala.
Pyramid Scene Parsing Network (PSPNet)
Modelo que integra información de contexto global a diferentes escalas utilizando un módulo de pooling piramidal antes de la predicción final.
Precisión de Píxel
Métrica de rendimiento simple que calcula el ratio de píxeles clasificados correctamente sobre el número total de píxeles en la imagen.
IoU Promedio (mIoU)
Promedio del IoU calculado sobre todas las clases de segmentación, ofreciendo una evaluación global del rendimiento del modelo.
Activación Softmax
Función de activación aplicada en la última capa para convertir los puntajes de clase en una distribución de probabilidad para cada píxel.
Pérdida Dice (Dice Loss)
Función de pérdida alternativa basada en el coeficiente de Dice, particularmente efectiva para manejar el desequilibrio de clases en tareas de segmentación.
Módulo de Contexto
Componente de red diseñado para capturar información contextual de largo alcance, esencial para una segmentación semántica precisa.
Refinamiento de Fronteras
Técnica o módulo adicional que busca mejorar la precisión de los contornos de los objetos segmentados, a menudo un punto débil de los métodos estándar.
Desequilibrio de Clases
Problema frecuente en segmentación donde algunas clases ocupan muchos menos píxeles que otras, requiriendo estrategias de entrenamiento adaptadas.
Minería de Píxeles Difíciles
Estrategia de entrenamiento que se concentra en los píxeles difíciles de clasificar (mal predichos) para acelerar la convergencia y mejorar el rendimiento.
Ambigüedad Semántica
Desafío donde un mismo píxel puede pertenecer a varias clases semánticamente cercanas, haciendo problemática la clasificación única.
Segmentación Panóptica
Tarea unificada que combina la segmentación semántica (clases) y la segmentación de instancias (objetos individuales) en una sola predicción coherente.