Glosario IA

El diccionario completo de la Inteligencia Artificial

231

categorías

2.999

subcategorías

35.535

términos

📖

términos

Modality Alignment

Proceso de entrenamiento destinado a alinear los espacios de representación de diferentes modalidades en un espacio vectorial común para facilitar las transferencias cross-modales.

📖

términos

Perceiver

Arquitectura Transformer generalista capaz de procesar datos multimodales arbitrarios utilizando un mecanismo de atención cross-attention entre entradas y un bottleneck latente.

📖

términos

Unified Multimodal Pre-training

Enfoque que pre-entrena un solo modelo en múltiples tareas y modalidades simultáneamente para obtener representaciones más generales y transferibles.

📖

términos

Image Captioning Transformer

Arquitectura encoder-decoder Transformer que genera automáticamente descripciones textuales descriptivas y coherentes para imágenes de entrada.

📖

términos

Audio-Visual Transformer

Modelo Transformer que procesa simultáneamente los flujos de audio y video para tareas como el reconocimiento audiovisual o la generación sincronizada.

📖

términos

Video Transformer

Variante de Vision Transformer adaptada al procesamiento secuencial de frames de video incorporando información temporal mediante la atención espacio-temporal.

📖

términos

Transformer-based Multimodal Fusion

Técnica que utiliza los mecanismos de atención de los Transformers para fusionar inteligentemente las características de múltiples modalidades a nivel semántico.

🔍

Glosario IA

Modality Alignment

Perceiver

Unified Multimodal Pre-training

Image Captioning Transformer

Audio-Visual Transformer

Video Transformer

Transformer-based Multimodal Fusion

No se encontraron resultados