Глоссарий ИИ
Полный словарь искусственного интеллекта
Полностью сверточная сеть (FCN)
Архитектура сверточной нейронной сети, которая заменяет полностью связанные слои сверточными слоями для генерации карт сегментации того же размера, что и входное изображение.
DeepLab
Семейство моделей семантической сегментации, использующих расширенные свертки (atrous) для увеличения receptive field без потери пространственного разрешения.
Расширенная свертка (Dilated Convolution)
Операция свертки, которая вставляет пробелы между пикселями ядра для увеличения receptive field и захвата контекста в большем масштабе.
Pyramid Scene Parsing Network (PSPNet)
Модель, которая интегрирует глобальный контекст на различных масштабах, используя модуль пирамидального пулинга перед окончательным предсказанием.
Точность по пикселям
Простая метрика производительности, которая вычисляет отношение правильно классифицированных пикселей к общему количеству пикселей в изображении.
Среднее IoU (mIoU)
Среднее значение IoU, рассчитанное для всех классов сегментации, обеспечивающее общую оценку производительности модели.
Активация Softmax
Функция активации, применяемая к последнему слою для преобразования оценок классов в распределение вероятностей для каждого пикселя.
Dice Loss
Альтернативная функция потерь, основанная на коэффициенте Dice, особенно эффективная для обработки дисбаланса классов в задачах сегментации.
Контекстный модуль
Компонент сети, предназначенный для захвата дальнодействующей контекстной информации, существенный для точной семантической сегментации.
Уточнение границ
Техника или дополнительный модуль, направленный на повышение точности контуров сегментированных объектов, часто являющийся слабым местом стандартных методов.
Дисбаланс классов
Частая проблема в сегментации, где некоторые классы занимают гораздо меньше пикселей, чем другие, требуя адаптированных стратегий обучения.
Выбор сложных пикселей
Стратегия обучения, которая фокусируется на трудно классифицируемых пикселях (неправильно предсказанных) для ускорения сходимости и улучшения производительности.
Семантическая неоднозначность
Проблема, при которой один и тот же пиксель может принадлежать нескольким семантически близким классам, что затрудняет уникальную классификацию.
Паноптическая сегментация
Единая задача, которая объединяет семантическую сегментацию (классы) и сегментацию экземпляров (отдельные объекты) в одно согласованное предсказание.