QA Multimodal
Tokenisation d'Image
Processus de conversion d'une image en une séquence de tokens discrets, souvent via un VAE ou un VQ-VAE, pour la rendre compatible avec les architectures de type Transformer.
← पीछे