Обнаружение с архитектурами Трансформеров

📖

термины

Обнаружение на основе запросов

Парадигма обнаружения, в которой обученные запросы (эмбеддинги) взаимодействуют с признаками изображения через механизм внимания для прямого предсказания ограничивающих рамок и классов объектов.

📖

термины

Запросы объектов

Векторы позиционного обучения в архитектурах DETR, которые действуют как «слоты» для каждого потенциального объекта, подлежащего обнаружению, направляя модель к конкретным предсказаниям.

📖

термины

Функция потерь двудольного сопоставления

Функция потерь, используемая в DETR, которая находит оптимальное взаимно-однозначное сопоставление между предсказаниями и эталонными значениями (ground truth) с использованием венгерского алгоритма, гарантируя уникальное присвоение для каждого объекта.

📖

термины

Многомасштабная пирамида признаков

Структура в детекторах на основе трансформеров, которая объединяет признаки различного разрешения для улучшения обнаружения объектов разного размера, часто с помощью механизмов межмасштабного внимания.

📖

термины

Обнаружение без анкеров

Подход к обнаружению, который исключает использование предопределенных опорных рамок (якорей), являясь ключевой особенностью архитектур трансформеров, которые напрямую предсказывают ограничивающие рамки.

📖

термины

Предсказание множества

Формулировка обнаружения объектов как задачи предсказания неупорядоченного множества, при которой модель одновременно предсказывает все объекты без заранее заданного порядка.

📖

термины

Обнаружение, агностичное к классам

Подход, при котором локализация и классификация объектов разделены, часто используемый в детекторах на основе трансформеров для улучшения обобщающей способности.

📖

термины

Бэкбон Vision Transformer (ViT)

Использование предварительно обученных ViT в качестве экстракторов признаков для детекторов на основе трансформеров, обеспечивающих мощное и контекстуальное представление изображений.

📖

термины

DINO (DETR с улучшенными шумоподавляющими якорями)

Усовершенствованная архитектура детекции, которая объединяет шумоподавленные запросы и якоря для улучшения производительности и скорости сходимости детекторов на основе трансформеров.

📖

термины

Обучение с шумоподавлением

Стратегия обучения, при которой модель учится восстанавливать эталонные данные из зашумленных версий, что повышает устойчивость и сходимость детекторов на основе трансформеров.

📖

термины

Внимание «запрос-экземпляр»

Специализированный механизм внимания, в котором каждый запрос объекта фокусируется на релевантных признаках конкретного экземпляра на изображении.

📖

термины

Назначение меток «один-ко-многим»

Альтернативная стратегия назначения в некоторых детекторах на основе трансформеров, при которой одна эталонная разметка может быть назначена нескольким предсказаниям для улучшения обучения.

Глоссарий ИИ

Обнаружение на основе запросов

Запросы объектов

Функция потерь двудольного сопоставления

Многомасштабная пирамида признаков

Обнаружение без анкеров

Предсказание множества

Обнаружение, агностичное к классам

Бэкбон Vision Transformer (ViT)

DINO (DETR с улучшенными шумоподавляющими якорями)

Обучение с шумоподавлением

Внимание «запрос-экземпляр»

Назначение меток «один-ко-многим»

Результаты не найдены