Multimodalité
Vision-Language Model
Classe de modèles d'IA spécialisés dans la compréhension conjointe du contenu visuel et textuel, capables de décrire des images ou de générer des images à partir de textes.
← Kembali