Difusão de Vídeo e Temporal
Atenção 3D
Mecanismo de atenção que processa simultaneamente as dimensões espaciais (altura, largura) e temporal (tempo) de um vídeo, permitindo ao modelo ponderar a importância de diferentes regiões em diferentes momentos para capturar as dependências espaço-temporais.
← Voltar