Глоссарий ИИ
Полный словарь искусственного интеллекта
Обнаружение на основе запросов
Парадигма обнаружения, в которой обученные запросы (эмбеддинги) взаимодействуют с признаками изображения через механизм внимания для прямого предсказания ограничивающих рамок и классов объектов.
Запросы объектов
Векторы позиционного обучения в архитектурах DETR, которые действуют как «слоты» для каждого потенциального объекта, подлежащего обнаружению, направляя модель к конкретным предсказаниям.
Функция потерь двудольного сопоставления
Функция потерь, используемая в DETR, которая находит оптимальное взаимно-однозначное сопоставление между предсказаниями и эталонными значениями (ground truth) с использованием венгерского алгоритма, гарантируя уникальное присвоение для каждого объекта.
Многомасштабная пирамида признаков
Структура в детекторах на основе трансформеров, которая объединяет признаки различного разрешения для улучшения обнаружения объектов разного размера, часто с помощью механизмов межмасштабного внимания.
Обнаружение без анкеров
Подход к обнаружению, который исключает использование предопределенных опорных рамок (якорей), являясь ключевой особенностью архитектур трансформеров, которые напрямую предсказывают ограничивающие рамки.
Предсказание множества
Формулировка обнаружения объектов как задачи предсказания неупорядоченного множества, при которой модель одновременно предсказывает все объекты без заранее заданного порядка.
Обнаружение, агностичное к классам
Подход, при котором локализация и классификация объектов разделены, часто используемый в детекторах на основе трансформеров для улучшения обобщающей способности.
Бэкбон Vision Transformer (ViT)
Использование предварительно обученных ViT в качестве экстракторов признаков для детекторов на основе трансформеров, обеспечивающих мощное и контекстуальное представление изображений.
DINO (DETR с улучшенными шумоподавляющими якорями)
Усовершенствованная архитектура детекции, которая объединяет шумоподавленные запросы и якоря для улучшения производительности и скорости сходимости детекторов на основе трансформеров.
Обучение с шумоподавлением
Стратегия обучения, при которой модель учится восстанавливать эталонные данные из зашумленных версий, что повышает устойчивость и сходимость детекторов на основе трансформеров.
Внимание «запрос-экземпляр»
Специализированный механизм внимания, в котором каждый запрос объекта фокусируется на релевантных признаках конкретного экземпляра на изображении.
Назначение меток «один-ко-многим»
Альтернативная стратегия назначения в некоторых детекторах на основе трансформеров, при которой одна эталонная разметка может быть назначена нескольким предсказаниям для улучшения обучения.