Глоссарий ИИ
Полный словарь искусственного интеллекта
Дилатационная свертка (или Atrous Convolution)
Операция свертки, которая вставляет пробелы между элементами ядра, позволяя увеличить рецептивное поле без увеличения количества параметров или вычислительной сложности.
Коэффициент дилатации (Dilation Rate)
Параметр дилатационных сверток, определяющий расстояние между пикселями ядра свертки, напрямую контролирующий увеличение рецептивного поля.
Энкодер-декодер с Atrous Convolution
Архитектура DeepLabv3+, которая объединяет мощный энкодер (например, ResNet) с простым и эффективным декодером для уточнения прогнозов сегментации, сохраняя при этом детали краев.
Коэффициент уменьшения разрешения (Output Stride)
Отношение разрешения входного изображения к разрешению итоговых карт признаков; DeepLab часто использует 'output stride', равный 16 или 8, для баланса между точностью и скоростью.
Признаки уровня изображения (Image-Level Features)
Глобальные признаки, извлеченные из всего изображения, часто с помощью глобального пулинга, и интегрированные в модуль ASPP DeepLab для улучшения классификации контекстных классов.
DeepLabv1
Первая версия DeepLab, которая внедрила использование дилатационных сверток в полносверточных сетях (FCN) для семантической сегментации, увеличивая рецептивное поле без потери разрешения.
DeepLabv2
Версия DeepLab, которая интегрировала модуль Atrous Spatial Pyramid Pooling (ASPP) для эффективного захвата многомасштабного контекста, став эталоном для семантической сегментации.
DeepLabv3
Версия, которая улучшила модуль ASPP, добавив глобальный пулинг и свертки 1x1, а также исследовала применение каскадных дилатационных сверток для повышения производительности.
DeepLabv3+
Последняя крупная версия, которая добавляет простой, но эффективный декодер в архитектуру DeepLabv3, уточняя предсказания сегментации путем объединения низкоуровневых и высокоуровневых признаков.
Полносвязное условное случайное поле (CRF)
Метод постобработки, использовавшийся в ранних версиях DeepLab для уточнения границ предсказаний сегментации путем моделирования отношений между всеми пикселями изображения.
Повышение дискретизации с помощью билинейной интерполяции
Техника, используемая в DeepLab для восстановления пространственного разрешения карт признаков после расширенных сверток, чтобы создать карту сегментации того же размера, что и входное изображение.
Агрегация контекста
Основной принцип DeepLab, направленный на агрегацию контекстной информации с разных пространственных масштабов благодаря расширенным сверткам и модулю ASPP для более надежного предсказания.