BERT et ses Variantes
VideoBERT
Extensión multimodal de BERT que aprende representaciones conjuntas de video y texto. Realiza el preentrenamiento en tokens visuales y lingüísticos para la comprensión de video.
← Volver