Transformadores Multimodales
Audio-Visual Transformer
Modelo Transformer que procesa simultáneamente los flujos de audio y video para tareas como el reconocimiento audiovisual o la generación sincronizada.
← Volver