Transformers pour Audio
Conformer
Une architecture de modèle hybride pour la reconnaissance vocale qui combine des modules de convolution, d'auto-attention et de feed-forward pour capturer à la fois les dépendances locales et globales dans les séquences audio.
← Tillbaka