Transformers Multimodaux
PaLI (Pathways Language and Image model)
Modèle multimodal massif basé sur Pathways, combinant un encodeur d'images et un encodeur-décodeur de texte pour des tâches de traduction visuelle et de réponse visuelle aux questions.
← Zurück