QA Multimodal
Codebook Vectoriel Quantifié (VQ)
Technique utilisée dans les modèles multimodaux pour discrétiser les représentations continues (ex: d'images) en un ensemble fini de tokens discrets, facilitant leur traitement par des modèles de langage.
← Retour