Tradução Multimodal
Aprendizagem Audiovisual
Aprendizagem automática que combina simultaneamente informações de áudio e vídeo para melhorar a compreensão de cenas multimodais. Essa abordagem explora a correlação natural entre sons e eventos visuais.
← Voltar