🏠 Inicio
Pruebas de rendimiento
📊 Todos los benchmarks 🦖 Dinosaurio v1 🦖 Dinosaurio v2 ✅ Aplicaciones To-Do List 🎨 Páginas libres creativas 🎯 FSACB - Showcase definitivo 🌍 Benchmark de traducción
Modelos
🏆 Top 10 modelos 🆓 Modelos gratuitos 📋 Todos los modelos ⚙️ Kilo Code
Recursos
💬 Biblioteca de prompts 📖 Glosario de IA 🔗 Enlaces útiles

Glosario IA

El diccionario completo de la Inteligencia Artificial

231
categorías
2.999
subcategorías
35.535
términos
📖
términos

Audio Transformer

Arquitectura Transformer adaptada para el procesamiento de señales de audio utilizando mecanismos de atención sobre representaciones temporales o freqúmicas de los datos de audio.

📖
términos

Spectrogram Transformer

Variante de Transformer que opera directamente sobre espectrogramas dividiéndolos en parches tratados como secuencias de embeddings para clasificación de audio.

📖
términos

Wav2Vec 2.0

Modelo de aprendizaje autosupervisado para representación de voz utilizando una arquitectura Transformer con enmascaramiento cuantificado sobre formas de onda brutas.

📖
términos

Whisper

Modelo Transformer robusto para reconocimiento de voz y traducción speech-to-text entrenado con 680k horas de datos de audio transcritos con supervisión débil.

📖
términos

AudioLM

Modelo similar al lenguaje para generación de audio utilizando Transformers jerárquicos sobre representaciones acústicas y semánticas discretas.

📖
términos

Encodec

Codificador neuronal basado en Transformer con cuantificación residual para compresión y reconstrucción de audio de alta fidelidad.

📖
términos

VALL-E

Modelo de síntesis de voz neural codec similar al lenguaje que utiliza Transformers para generar voz de alta calidad a partir de prompts de voz de 3 segundos.

📖
términos

Wav2Vec-U

Enfoque no supervisado para ASR utilizando modelos wav2vec 2.0 preentrenados sin transcripción, aprovechando los alineamientos fonéticos implícitos.

📖
términos

MusicGen

Modelo Transformer condicional para la generación musical utilizando tokenizadores de audio y controlable por descripciones textuales o melodías.

📖
términos

MERT

Music Envelope Representation Transformer, modelo preentrenado autosupervisado para la comprensión musical utilizando representaciones multi-escala.

📖
términos

Spec2Vec

Arquitectura Transformer que convierte espectrogramas en embeddings vectoriales para tareas de clasificación y recuperación de audio.

🔍

No se encontraron resultados