Сегментация с помощью DeepLab

📖

термины

Дилатационная свертка (или Atrous Convolution)

Операция свертки, которая вставляет пробелы между элементами ядра, позволяя увеличить рецептивное поле без увеличения количества параметров или вычислительной сложности.

📖

термины

Коэффициент дилатации (Dilation Rate)

Параметр дилатационных сверток, определяющий расстояние между пикселями ядра свертки, напрямую контролирующий увеличение рецептивного поля.

📖

термины

Энкодер-декодер с Atrous Convolution

Архитектура DeepLabv3+, которая объединяет мощный энкодер (например, ResNet) с простым и эффективным декодером для уточнения прогнозов сегментации, сохраняя при этом детали краев.

📖

термины

Коэффициент уменьшения разрешения (Output Stride)

Отношение разрешения входного изображения к разрешению итоговых карт признаков; DeepLab часто использует 'output stride', равный 16 или 8, для баланса между точностью и скоростью.

📖

термины

Признаки уровня изображения (Image-Level Features)

Глобальные признаки, извлеченные из всего изображения, часто с помощью глобального пулинга, и интегрированные в модуль ASPP DeepLab для улучшения классификации контекстных классов.

📖

термины

DeepLabv1

Первая версия DeepLab, которая внедрила использование дилатационных сверток в полносверточных сетях (FCN) для семантической сегментации, увеличивая рецептивное поле без потери разрешения.

📖

термины

DeepLabv2

Версия DeepLab, которая интегрировала модуль Atrous Spatial Pyramid Pooling (ASPP) для эффективного захвата многомасштабного контекста, став эталоном для семантической сегментации.

📖

термины

DeepLabv3

Версия, которая улучшила модуль ASPP, добавив глобальный пулинг и свертки 1x1, а также исследовала применение каскадных дилатационных сверток для повышения производительности.

📖

термины

DeepLabv3+

Последняя крупная версия, которая добавляет простой, но эффективный декодер в архитектуру DeepLabv3, уточняя предсказания сегментации путем объединения низкоуровневых и высокоуровневых признаков.

📖

термины

Полносвязное условное случайное поле (CRF)

Метод постобработки, использовавшийся в ранних версиях DeepLab для уточнения границ предсказаний сегментации путем моделирования отношений между всеми пикселями изображения.

📖

термины

Повышение дискретизации с помощью билинейной интерполяции

Техника, используемая в DeepLab для восстановления пространственного разрешения карт признаков после расширенных сверток, чтобы создать карту сегментации того же размера, что и входное изображение.

📖

термины

Агрегация контекста

Основной принцип DeepLab, направленный на агрегацию контекстной информации с разных пространственных масштабов благодаря расширенным сверткам и модулю ASPP для более надежного предсказания.

Глоссарий ИИ

Дилатационная свертка (или Atrous Convolution)

Коэффициент дилатации (Dilation Rate)

Энкодер-декодер с Atrous Convolution

Коэффициент уменьшения разрешения (Output Stride)

Признаки уровня изображения (Image-Level Features)

DeepLabv1

DeepLabv2

DeepLabv3

DeepLabv3+

Полносвязное условное случайное поле (CRF)

Повышение дискретизации с помощью билинейной интерполяции

Агрегация контекста

Результаты не найдены