Difusión de Video y Temporal
Atención 3D
Mecanismo de atención que procesa simultáneamente las dimensiones espaciales (altura, anchura) y temporal (tiempo) de un video, permitiendo al modelo ponderar la importancia de diferentes regiones a través de distintos momentos para capturar dependencias espacio-temporales.
← Volver