Glossaire IA
Le dictionnaire complet de l'Intelligence Artificielle
Traduction Automatique Neuronale (NMT)
Approche de traduction automatique utilisant des réseaux de neurones profonds pour modéliser la correspondance entre langues, constituant la base des systèmes QA cross-lingue modernes.
Représentations Multilingues
Espaces vectoriels partagés où les mots et phrases de différentes langues sont projetés dans un même espace sémantique, permettant le transfert de connaissances entre langues.
Alignement Interlingue
Processus de mise en correspondance des structures linguistiques et sémantiques entre différentes langues pour faciliter le transfert d'informations dans les systèmes QA.
Projection de Langue
Technique consistant à traduire uniquement la question ou les documents dans une langue pivot commune avant d'appliquer un système monolingue de QA.
Tokenisation Multilingue
Processus de segmentation du texte en unités de base (tokens) prenant en compte les spécificités morphologiques et syntaxiques de multiples langues simultanément.
Fine-Tuning Cross-Lingue
Phase d'adaptation d'un modèle multilingue pré-entraîné sur des données spécifiques à une tâche QA dans une ou plusieurs langues cibles.
Décalage Linguistique (Language Shift)
Phénomène où les performances d'un modèle se dégradent lors du passage d'une langue haute-ressource à une langue basse-ressource dans les systèmes QA cross-lingues.
Embeddings Contextuels Multilingues
Représentations vectorielles dynamiques qui capturent le sens des mots en fonction de leur contexte, partagées à travers plusieurs langues pour une meilleure compréhension sémantique.
Rétro-Traduction (Back-Translation)
Méthode d'augmentation de données où des textes sont traduits dans une langue cible puis retraduits vers la langue source pour générer des données d'entraînement synthétiques.
Pondération des Langues
Stratégie d'échantillonnage des données d'entraînement visant à équilibrer la contribution de chaque langue pour éviter la domination des langues à haut volume de données.
Détection de Langue
Composant essentiel des systèmes QA cross-lingues qui identifie automatiquement la langue de la question d'entrée pour orienter le traitement approprié.
Normalisation Cross-Lingue
Processus de standardisation des représentations textuelles à travers les langues pour réduire les variations linguistiques et améliorer la robustesse du système QA.
Modèles de Langue Universels
Modèles conçus pour capturer les régularités linguistiques communes à toutes les langues humaines, servant de fondation aux systèmes QA véritablement multilingues.
Code-Switching Adaptation
Capacité d'un système QA à traiter des questions contenant un mélange de plusieurs langues, un phénomène courant dans les contextes multilingues naturels.
Évaluation Cross-Lingue
Méthodologies spécifiques pour mesurer les performances des systèmes QA à travers les paires linguistiques, incluant des métriques comme le XNLI ou le MLQA.