Glosario IA

El diccionario completo de la Inteligencia Artificial

231

categorías

2.999

subcategorías

35.535

términos

📖

términos

Audio Transformer

Arquitectura Transformer adaptada para el procesamiento de señales de audio utilizando mecanismos de atención sobre representaciones temporales o freqúmicas de los datos de audio.

📖

términos

Spectrogram Transformer

Variante de Transformer que opera directamente sobre espectrogramas dividiéndolos en parches tratados como secuencias de embeddings para clasificación de audio.

📖

términos

Wav2Vec 2.0

Modelo de aprendizaje autosupervisado para representación de voz utilizando una arquitectura Transformer con enmascaramiento cuantificado sobre formas de onda brutas.

📖

términos

Whisper

Modelo Transformer robusto para reconocimiento de voz y traducción speech-to-text entrenado con 680k horas de datos de audio transcritos con supervisión débil.

📖

términos

AudioLM

Modelo similar al lenguaje para generación de audio utilizando Transformers jerárquicos sobre representaciones acústicas y semánticas discretas.

📖

términos

Encodec

Codificador neuronal basado en Transformer con cuantificación residual para compresión y reconstrucción de audio de alta fidelidad.

📖

términos

VALL-E

Modelo de síntesis de voz neural codec similar al lenguaje que utiliza Transformers para generar voz de alta calidad a partir de prompts de voz de 3 segundos.

📖

términos