Modèles Multimodaux
Tokenisation Multimodale
Processus de conversion de différentes modalités (image, audio, vidéo) en séquences de tokens compatibles avec l'architecture Transformer.
← RetourProcessus de conversion de différentes modalités (image, audio, vidéo) en séquences de tokens compatibles avec l'architecture Transformer.
← Retour