Transformers para Áudio
Conformer
Uma arquitetura de modelo híbrido para reconhecimento de fala que combina módulos de convolução, autoatenção e feed-forward para capturar dependências locais e globais em sequências de áudio.
← Voltar