🏠 Início
Avaliações
📊 Todos os Benchmarks 🦖 Dinossauro v1 🦖 Dinossauro v2 ✅ Aplicações To-Do List 🎨 Páginas Livres Criativas 🎯 FSACB - Showcase Definitivo 🌍 Benchmark de Tradução
Modelos
🏆 Top 10 Modelos 🆓 Modelos Gratuitos 📋 Todos os Modelos ⚙️ Kilo Code
Recursos
💬 Biblioteca de Prompts 📖 Glossário de IA 🔗 Links Úteis

Glossário IA

O dicionário completo da Inteligência Artificial

242
categorias
3.306
subcategorias
39.932
termos
📖
termos

Audio Transformer

Arquitetura Transformer adaptada para o processamento de sinais de áudio, utilizando mecanismos de atenção em representações temporais ou de frequência dos dados de áudio.

📖
termos

Spectrogram Transformer

Variante de Transformer operando diretamente em espectrogramas, dividindo-os em patches tratados como sequências de embeddings para classificação de áudio.

📖
termos

Wav2Vec 2.0

Modelo de aprendizagem auto-supervisionada para representação de fala, utilizando uma arquitetura Transformer com mascaramento quantificado em formas de onda brutas.

📖
termos

Whisper

Modelo Transformer robusto para reconhecimento de fala e tradução speech-to-text, treinado em 680 mil horas de dados de áudio transcritos com supervisão fraca.

📖
termos

AudioLM

Modelo language-like para geração de áudio, utilizando Transformers hierárquicos em representações acústicas e semânticas discretas.

📖
termos

Encodec

Codec neural baseado em Transformer com quantização residual para compressão e reconstrução de áudio de alta fidelidade.

📖
termos

VALL-E

Modelo de síntese de fala neural codec language utilizando Transformers para gerar fala de alta qualidade a partir de prompts de voz de 3 segundos.

📖
termos

Wav2Vec-U

Abordagem não supervisionada para ASR utilizando modelos wav2vec 2.0 pré-treinados sem transcrição, explorando os alinhamentos fonéticos implícitos.

📖
termos

MusicGen

Modelo Transformer condicional para geração musical usando tokenizadores de áudio e controlável por descrições textuais ou melodias.

📖
termos

MERT

Music Envelope Representation Transformer, modelo pré-treinado auto-supervisionado para compreensão musical usando representações multi-escala.

📖
termos

Spec2Vec

Arquitetura Transformer que converte espectrogramas em embeddings vetoriais para tarefas de classificação e recuperação de áudio.

🔍

Nenhum resultado encontrado