Глоссарий ИИ
Полный словарь искусственного интеллекта
SSD (Single Shot MultiBox Detector)
Архитектура обнаружения объектов, которая устраняет предложения регионов, используя якорные блоки по умолчанию в нескольких масштабах на картах признаков с разным разрешением для быстрого и точного обнаружения.
Якорные рамки (Anchor Boxes)
Наборы предопределенных рамок с конкретными высотами и ширинами, используемые в качестве ссылок для прогнозирования ограничивающих рамок объектов, ускоряющие сходимость и улучшающие точность в детекторах в один этап.
RetinaNet
Архитектура обнаружения в один этап, вводящая функцию потерь Focal Loss для решения проблемы экстремального дисбаланса между классами фона и переднего плана, достигающая производительности, сравнимой с моделями в два этапа.
Эффективность обнаружения
Метрика производительности, которая оценивает компромисс между точностью обнаружения и скоростью вывода, часто выражаемая в кадрах в секунду (FPS) для данной средней точности (mAP).
Карта признаков
Пространственное представление признаков, извлеченных слоем сверточной нейронной сети, где каждая точка соответствует области входного изображения и кодирует семантическую информацию для обнаружения.
Рецептивное поле
Область входного изображения, которая влияет на конкретный нейрон в карте признаков, размер которой увеличивается с глубиной сети и является критической для обнаружения объектов в разных масштабах.
Плотное обнаружение
Стратегия обнаружения, которая прогнозирует объекты в каждой пространственной позиции карты признаков, в отличие от разреженных методов, позволяющая более полное обнаружение, но требующая эффективного управления избыточными предсказаниями.
Многоуровневый (Multi-Scale)
Подход к обнаружению, который одновременно обрабатывает признаки с разным пространственным разрешением для улучшения обнаружения объектов разного размера, часто реализуемый через пирамиды признаков или параллельные ветви.
Оценка уверенности (Confidence Score)
Значение вероятности, предсказанное моделью, указывающее степень уверенности в том, что ограничивающая рамка содержит объект определенного класса, используемое для фильтрации и оценки обнаружений.
Область интереса (Region of Interest)
Конкретная область изображения, на которой модель концентрируется для обнаружения или классификации, в одноэтапных детекторах неявно определяемая предсказаниями на сетке признаков.
Базовая сеть (Backbone)
Предварительно обученная сверточная нейронная сеть (такая как ResNet, VGG или Darknet), используемая как основной экстрактор признаков в архитектуре обнаружения, обеспечивающая фундаментальные визуальные представления.
Головка обнаружения (Detection Head)
Конечный модуль одноэтапного детектора, который принимает извлеченные базовой сетью признаки и предсказывает ограничивающие рамки, классы и оценки уверенности для каждой позиции сетки.
Смещение рамки (Box Offset)
Предсказание смещения относительно предварительно определенных якорных рамок для уточнения локализации объектов, представляющее различия в координатах (x, y) и размерах (ширина, высота) между предсказанием и якорем.