Глоссарий ИИ

Полный словарь искусственного интеллекта

235

категории

2 988

подкатегории

33 628

термины

📖

термины

Патчи изображений

Разделение изображения на регулярную сетку из маленьких квадратных секций (обычно 16x16 пикселей), которые обрабатываются как последовательные токены в ViT.

📖

термины

Визуальная токенизация

Процесс сегментации изображения в последовательность дискретных токенов, являющийся основополагающим для адаптации архитектуры трансформера, изначально разработанной для текста, к визуальным данным.

📖

термины

DeiT (Data-efficient Image Transformer)

Вариант Vision Transformer, обученный с использованием стратегий дистилляции для достижения конкурентоспособных результатов при меньшем объеме обучающих данных.

📖

термины

Иерархические визуальные трансформеры

Архитектуры трансформеров, которые поддерживают многоуровневые представления изображения, объединяя преимущества традиционных CNN с гибкостью трансформеров.

📖

термины

Масштабирование слоев

Техника нормализации, применяемая к остаткам в слоях трансформера для стабилизации обучения и улучшения сходимости глубоких моделей.

📖

термины

Визуальный трансформер с перекрестным вниманием

Архитектура, использующая механизмы перекрестного внимания между различными модальностями или представлениями, позволяющая осуществлять более богатые взаимодействия между признаками.

📖

термины

Самовнимание на основе окон

Вариант самовнимания, ограниченный локальными окнами, а не всем изображением, что снижает вычислительную сложность, сохраняя при этом важные локальные связи.

🔍

Глоссарий ИИ

Патчи изображений

Визуальная токенизация

DeiT (Data-efficient Image Transformer)

Иерархические визуальные трансформеры

Масштабирование слоев

Визуальный трансформер с перекрестным вниманием

Самовнимание на основе окон

Результаты не найдены