Glossaire IA
Le dictionnaire complet de l'Intelligence Artificielle
Base de connaissances structurée
Ensemble de données organisées selon un schéma prédéfini (ex: graphes de connaissances, bases de données relationnelles) utilisé pour stocker et récupérer des informations factuelles pour le système QA.
Extraction d'Entités Nommées (NER)
Processus de TAL qui identifie et catégorise les informations clés (noms de personnes, d'organisations, de médicaments, etc.) dans un texte non structuré pour alimenter la base de connaissances.
Génération de Questions Synthétiques
Technique d'augmentation de données où des questions et leurs réponses sont créées automatiquement à partir de documents existants pour entraîner des modèles QA avec peu de données réelles.
Raisonnement sur graphe de connaissances
Capacité d'un système QA à déduire de nouvelles informations en parcourant et en combinant les relations (arêtes) entre les entités (nœuds) d'un graphe de connaissances.
Réécriture de requête
Processus qui transforme une question utilisateur, souvent ambiguë ou mal formulée, en une requête optimisée pour la recherche d'informations ou l'interrogation d'une base de connaissances.
Vérification factuelle (Fact Checking)
Mécanisme qui valide la cohérence et l'exactitude d'une réponse générée en la croisant avec des sources fiables du domaine, crucial pour les applications à haut risque comme la médecine ou la finance.
Modèle de langage spécialisé (Domain-Specific LM)
Modèle de langage pré-entraîné ou affiné sur un corpus de textes spécifique à un domaine (ex: articles médicaux, jurisprudence), lui permettant de comprendre et générer un jargon technique avec plus de précision.
Système QA hybride
Architecture qui combine plusieurs approches (ex: extraction à base de règles, recherche sémantique, modèles neuronaux) pour tirer parti de leurs forces respectives et améliorer la robustesse et la précision des réponses.
Explicabilité des réponses (Answer Explainability)
Capacité d'un système QA à fournir non seulement une réponse, mais aussi les preuves, les sources ou le raisonnement qui ont mené à cette réponse, essentielle pour la confiance de l'utilisateur.
Indexation sémantique
Technique qui organise les documents en se basant sur leur signification et leur contexte (souvent via des embeddings), plutôt que sur des mots-clés, pour permettre une recherche plus pertinente.
Pipeline de traitement de l'information
Séquence ordonnée d'étapes (ex: ingestion, nettoyage, NER, indexation) qui transforme les données brutes en une base de connaissances structurée et interrogeable pour le système QA.
Fine-tuning sur données de QA
Processus d'adaptation d'un modèle de langage pré-entraîné en utilisant un jeu de données de paires question-réponse spécifiques à un domaine pour améliorer ses performances sur la tâche de question-réponse.
Détection d'intention de question
Classification du type d'information recherchée par l'utilisateur (ex: définition, comparaison, liste, cause-effet) pour orienter la stratégie de recherche et de génération de la réponse la plus appropriée.