Глоссарий ИИ
Полный словарь искусственного интеллекта
Fusion cross-modale
Processus d'intégration de caractéristiques provenant de différentes modalités dans un espace de représentation commun pour permettre des interactions cohérentes entre les types de données.
Architecture Transformer multi-tête
Structure neuronale utilisant des mécanismes d'attention parallèles pour traiter simultanément les relations entre différentes modalités dans l'espace latent partagé.
Génération co-créative
Approche où plusieurs modalités sont générées simultanément de manière interdépendante, chacune influençant et étant influencée par les autres en temps réel.
Pipeline de diffusion unifié
Architecture intégrée où toutes les modalités suivent le même processus de diffusion et de débruitage, partageant les étapes intermédiaires pour une meilleure cohérence.
Mécanisme d'attention multi-modale
Système permettant au modèle de pondérer dynamiquement l'importance des différentes modalités lors de la génération, en fonction du contexte et des entrées conditionnelles.
Modèle de base universel
Architecture pré-entraînée sur plusieurs modalités servant de fondation pour diverses tâches de génération multi-modale sans nécessiter d'entraînement spécifique.
Diffusion guidée par texte
Technique où la description textuelle guide le processus de diffusion pour générer des outputs cohérents dans les modalités visuelle, auditive ou vidéo correspondantes.
Projection modale
Transformation mathématique mappant les représentations de différentes modalités vers un espace latent commun tout en préservant leurs caractéristiques spécifiques.
Génération zéro-shot
Capacité des modèles multi-modaux à générer des combinaisons de modalités jamais vues pendant l'entraînement, grâce à leur compréhension des relations inter-modales.
Mécanisme de porte modal
Système de contrôle neuronal régulant sélectivement le flux d'information entre les différentes modalités pendant le processus de génération et de diffusion.
Fusion de caractéristiques hiérarchique
Stratégie combinant les caractéristiques multi-modales à différents niveaux d'abstraction, depuis les bas-niveaux sémantiques jusqu'aux concepts de haut-niveau.