Glossaire IA
Le dictionnaire complet de l'Intelligence Artificielle
Modèle Multimodal
Architecture d'intelligence artificielle capable de traiter et d'intégrer simultanément plusieurs types de données comme le texte, les images, l'audio et la vidéo dans un cadre unifié.
Fusion Précoce
Stratégie d'intégration multimodale où les différentes modalités sont combinées au niveau des caractéristiques brutes avant le traitement par le modèle principal.
Fusion Tardive
Approche multimodale où chaque modalité est traitée indépendamment jusqu'aux dernières couches du modèle, avant de fusionner les représentations pour la décision finale.
Alignement Cross-modal
Processus d'apprentissage visant à établir des correspondances sémantiques entre différentes modalités dans un espace de représentation commun.
Encodage Vision-Language
Mécanisme transformant simultanément des entrées visuelles et textuelles en représentations vectorielles compatibles pour le traitement conjoint.
Attention Cross-modal
Mécanisme d'attention permettant au modèle de pondérer dynamiquement l'importance des informations d'une modalité par rapport à une autre.
Embeddings Multimodaux
Représentations vectorielles denses qui encodent des informations provenant de plusieurs modalités dans un espace sémantique partagé.
Apprentissage Zero-shot Multimodal
Capacité d'un modèle multimodal à généraliser à de nouvelles tâches ou combinaisons de modalités sans exemples d'entraînement spécifiques.
Tokenisation Multimodale
Processus de conversion de différentes modalités (image, audio, vidéo) en séquences de tokens compatibles avec l'architecture Transformer.
Pré-entraînement Contrastif Multimodal
Méthode d'auto-supervision maximisant la similarité entre paires multimodales positives tout en minimisant celle des paires négatives.
Projection Espace Latent Commun
Transformation linéaire ou non-linéaire alignant les espaces de représentation de différentes modalités dans un espace vectoriel unifié.
Architecture Hybride Encodeur-Décodeur
Structure combinant des encodeurs spécialisés par modalité avec un décodeur unifié pour la génération de sorties multimodales.
Fine-tuning Multimodal
Processus d'adaptation d'un modèle pré-entraîné multimodal à des tâches spécifiques tout en préservant ses capacités de traitement intermodal.
Prompt Engineering Multimodal
Technique d'optimisation des entrées combinant texte et autres modalités pour guider efficacement les modèles multimodaux vers des sorties désirées.
Raisonnement Chaîne de Pensée Multimodal
Capacité d'un modèle à générer des étapes de raisonnement explicites en intégrant des preuves provenant de multiples modalités.
Génération Conditionnée Multimodale
Processus de création de contenu dans une modalité cible basé sur des conditions ou contraintes fournies dans d'autres modalités.
Fusion Intermédiaire
Stratégie d'intégration multimodale où les modalités sont fusionnées à plusieurs niveaux intermédiaires du réseau neuronal.
Transformers Multimodaux
Extension de l'architecture Transformer capable de traiter simultanément des séquences provenant de différentes modalités avec des mécanismes d'attention adaptés.