🏠 Главная
Бенчмарки
📊 Все бенчмарки 🦖 Динозавр v1 🦖 Динозавр v2 ✅ Приложения To-Do List 🎨 Творческие свободные страницы 🎯 FSACB - Ультимативный показ 🌍 Бенчмарк перевода
Модели
🏆 Топ-10 моделей 🆓 Бесплатные модели 📋 Все модели ⚙️ Режимы Kilo Code
Ресурсы
💬 Библиотека промптов 📖 Глоссарий ИИ 🔗 Полезные ссылки

Глоссарий ИИ

Полный словарь искусственного интеллекта

235
категории
2 988
подкатегории
33 628
термины
📖
термины

Патчи изображений

Разделение изображения на регулярную сетку из маленьких квадратных секций (обычно 16x16 пикселей), которые обрабатываются как последовательные токены в ViT.

📖
термины

Визуальная токенизация

Процесс сегментации изображения в последовательность дискретных токенов, являющийся основополагающим для адаптации архитектуры трансформера, изначально разработанной для текста, к визуальным данным.

📖
термины

DeiT (Data-efficient Image Transformer)

Вариант Vision Transformer, обученный с использованием стратегий дистилляции для достижения конкурентоспособных результатов при меньшем объеме обучающих данных.

📖
термины

Иерархические визуальные трансформеры

Архитектуры трансформеров, которые поддерживают многоуровневые представления изображения, объединяя преимущества традиционных CNN с гибкостью трансформеров.

📖
термины

Масштабирование слоев

Техника нормализации, применяемая к остаткам в слоях трансформера для стабилизации обучения и улучшения сходимости глубоких моделей.

📖
термины

Визуальный трансформер с перекрестным вниманием

Архитектура, использующая механизмы перекрестного внимания между различными модальностями или представлениями, позволяющая осуществлять более богатые взаимодействия между признаками.

📖
термины

Самовнимание на основе окон

Вариант самовнимания, ограниченный локальными окнами, а не всем изображением, что снижает вычислительную сложность, сохраняя при этом важные локальные связи.

🔍

Результаты не найдены