Transformadores Multimodales
Video Transformer
Variante de Vision Transformer adaptada al procesamiento secuencial de frames de video incorporando información temporal mediante la atención espacio-temporal.
← Volver