🏠 Inicio
Pruebas de rendimiento
📊 Todos los benchmarks 🦖 Dinosaurio v1 🦖 Dinosaurio v2 ✅ Aplicaciones To-Do List 🎨 Páginas libres creativas 🎯 FSACB - Showcase definitivo 🌍 Benchmark de traducción
Modelos
🏆 Top 10 modelos 🆓 Modelos gratuitos 📋 Todos los modelos ⚙️ Kilo Code
Recursos
💬 Biblioteca de prompts 📖 Glosario de IA 🔗 Enlaces útiles

Glosario IA

El diccionario completo de la Inteligencia Artificial

231
categorías
2.999
subcategorías
35.535
términos
📖
términos

Parches de Imagen

División de una imagen en cuadrículas regulares de pequeñas secciones cuadradas (típicamente 16x16 píxeles) que son procesadas como tokens secuenciales por el ViT.

📖
términos

Tokenización Visual

Proceso de segmentación de una imagen en secuencia de tokens discretos, fundamental para adaptar la arquitectura transformer diseñada inicialmente para el texto a los datos visuales.

📖
términos

DeiT (Data-efficient Image Transformer)

Variante de Vision Transformer entrenada con estrategias de destilación para alcanzar un rendimiento competitivo con menos datos de entrenamiento.

📖
términos

Transformers Visuales Jerárquicos

Arquitecturas transformer que mantienen representaciones multi-escala de la imagen, combinando las ventajas de las CNN tradicionales con la flexibilidad de los transformers.

📖
términos

Escalado de Capa

Técnica de normalización aplicada a los residuos en las capas transformer para estabilizar el entrenamiento y mejorar la convergencia de los modelos profundos.

📖
términos

Transformer Visual de Atención Cruzada

Arquitectura que utiliza mecanismos de atención cruzada entre diferentes modalidades o representaciones, permitiendo interacciones más ricas entre características.

📖
términos

Auto-atención Basada en Ventanas

Variante de atención restringida a ventanas locales en lugar de la imagen completa, reduciendo la complejidad computacional mientras captura las relaciones locales importantes.

🔍

No se encontraron resultados