Glossaire IA
Le dictionnaire complet de l'Intelligence Artificielle
Reconnaissance d'Entités Nommées (REN)
Sous-tâche du Traitement Automatique du Langage (TAL) visant à identifier et classifier des entités prédéfinies comme les personnes, organisations ou lieux dans un texte non structuré.
Extraction d'Entités
Processus d'identification et d'isolement d'informations structurées spécifiques (entités) à partir de données textuelles non structurées pour alimenter une base de connaissances.
Tagging d'Entités
Action d'associer des étiquettes (tags) sémantiques aux entités extraites d'un texte, permettant leur classification et leur utilisation dans des systèmes de question-réponse.
Dictionnaire d'Entités
Base de données ou liste structurée contenant les entités valides et leurs types, utilisée comme référence pour la reconnaissance et la validation dans un système QA.
Apprentissage Supervisé pour la REN
Approche où un modèle de REN est entraîné sur un corpus textuel annoté manuellement pour apprendre à reconnaître et classifier les entités.
Modèle de Séquence à Séquence (Seq2Seq)
Architecture de réseau de neurones utilisée pour des tâches de REN complexes, traitant une séquence d'entrée (texte) pour produire une séquence de sortie (étiquettes d'entités).
Embeddings de Contexte (ELMo, BERT)
Représentations vectorielles de mots qui capturent leur signification en fonction du contexte environnant, améliorant considérablement la précision de l'extraction d'entités ambigües.
Normalisation d'Entités
Processus de standardisation des entités extraites (ex: transformer 'Mardi', 'mar.' et 'Mardi' en une forme canonique) pour garantir la cohérence des données.
Liaison d'Entités (Entity Linking)
Tâche consistant à connecter une entité nommée mentionnée dans un texte à une entrée unique dans une base de connaissances (ex: un URI DBpedia ou Wikidata).
Corpus Annoté
Ensemble de textes où les entités ont été préalablement identifiées et étiquetées par des humains, servant de vérité terrain pour entraîner et évaluer les modèles de REN.
Fausse Positive en Extraction
Erreur où le système identifie incorrectement un segment de texte comme une entité pertinente, impactant négativement la précision du système de question-réponse.
Pipeline d'Extraction
Enchaînement séquentiel de modules (tokenisation, REN, normalisation, liaison) qui transforment un texte brut en entités structurées exploitables.
Système QA à Base de Connaissances
Type de système de question-réponse qui trouve des réponses en interrogeant une base de connaissances structurée, peuplée par l'extraction d'entités et de relations.
NER Hybride
Approche combinant des méthodes basées sur des règles (pattern matching) et des modèles d'apprentissage automatique pour tirer parti de la précision des premiers et de la flexibilité des seconds.
Désambiguïsation d'Entités
Tâche de résolution de l'ambiguïté lorsqu'une même chaîne de caractères peut faire référence à plusieurs entités distinctes (ex: 'Paris' la ville vs. 'Paris' le mythe).
Fine-Tuning pour la REN
Processus d'adaptation d'un modèle de langage pré-entraîné (comme BERT) sur un corpus spécifique pour une tâche de reconnaissance d'entités nommées.