Глоссарий ИИ
Полный словарь искусственного интеллекта
Классификация видеосцен
Процесс ИИ, который автоматически классифицирует визуальные окружения и контексты в видеопоследовательностях, используя глубокие нейронные сети для анализа пространственно-временных характеристик.
Пространственно-временная CNN
Архитектура нейронной сети, которая одновременно обрабатывает пространственные (высота, ширина) и временные (время) измерения видео для захвата динамики сцен.
Оптический поток
Вычислительная техника, которая рассчитывает движение пикселей между последовательными кадрами для обнаружения движения объектов и изменений сцены в видео.
Двухпоточные сети
Архитектура CNN, которая параллельно обрабатывает статическую визуальную информацию (RGB поток) и информацию о движении (оптический поток) для надежной классификации видео.
3D CNN
Сверточная нейронная сеть, использующая 3D свертки для извлечения характеристик непосредственно из видеоволумов, сохраняя временную информацию.
Механизм внимания в видео
Модуль глубокого обучения, который динамически взвешивает важность различных пространственных и временных областей в видео для улучшения классификации.
Временная сегментация
Процесс, который автоматически разделяет видео на согласованные временные сегменты на основе изменений сцены или действия для более тонкого анализа.
Анализ контекста сцены
Метод, который оценивает отношения между объектами, действиями и окружением для понимания глобального контекста видеосцены перед классификацией.
Видео эмбеддинг
Плотное и компактное векторное представление видео, которое захватывает его основные характеристики для задач классификации и определения схожести.
Сэмплирование кадров
Стратегия интеллектуального выбора ключевых изображений в видео для оптимизации вычислительной производительности при сохранении релевантной информации.
Видео LSTM
Вариант рекуррентных сетей, специально разработанный для моделирования долгосрочных зависимостей в видео временных последовательностях.
Видео трансформер
Архитектура на основе механизмов внимания, которая обрабатывает видео как последовательности пространственно-временных патчей для эффективной классификации.
Агрегация видео характеристик
Техника, которая объединяет характеристики, извлеченные из множества кадров, для создания унифицированного представления видео сцены.
Генерация графов сцены
Метод, который строит структурированные представления отношений между объектами и действиями в видео для глубокого семантического понимания.
Мультимодальное обучение видео
Подход, который одновременно интегрирует несколько типов данных (визуальные, аудио, текст) для улучшения устойчивости классификации сцен.
Пространственно-временные характеристики
Дескрипторы, которые совместно захватывают пространственный вид объектов и их временную эволюцию для эффективного представления видео сцен.
Распознавание действий на видео
Подзадача классификации, которая специфически идентифицирует человеческие действия или движения объектов в видеопоследовательностях.
Обнаружение объектов на видео
Техника, которая локализует и идентифицирует объекты, присутствующие в каждом кадре видео, обеспечивая временную согласованность обнаружений.