QA par Extraction d'Entités

📖

termes

Reconnaissance d'Entités Nommées (REN)

Sous-tâche du Traitement Automatique du Langage (TAL) visant à identifier et classifier des entités prédéfinies comme les personnes, organisations ou lieux dans un texte non structuré.

📖

termes

Extraction d'Entités

Processus d'identification et d'isolement d'informations structurées spécifiques (entités) à partir de données textuelles non structurées pour alimenter une base de connaissances.

📖

termes

Tagging d'Entités

Action d'associer des étiquettes (tags) sémantiques aux entités extraites d'un texte, permettant leur classification et leur utilisation dans des systèmes de question-réponse.

📖

termes

Dictionnaire d'Entités

Base de données ou liste structurée contenant les entités valides et leurs types, utilisée comme référence pour la reconnaissance et la validation dans un système QA.

📖

termes

Apprentissage Supervisé pour la REN

Approche où un modèle de REN est entraîné sur un corpus textuel annoté manuellement pour apprendre à reconnaître et classifier les entités.

📖

termes

Modèle de Séquence à Séquence (Seq2Seq)

Architecture de réseau de neurones utilisée pour des tâches de REN complexes, traitant une séquence d'entrée (texte) pour produire une séquence de sortie (étiquettes d'entités).

📖

termes

Embeddings de Contexte (ELMo, BERT)

Représentations vectorielles de mots qui capturent leur signification en fonction du contexte environnant, améliorant considérablement la précision de l'extraction d'entités ambigües.

📖

termes

Normalisation d'Entités

Processus de standardisation des entités extraites (ex: transformer 'Mardi', 'mar.' et 'Mardi' en une forme canonique) pour garantir la cohérence des données.

📖

termes

Liaison d'Entités (Entity Linking)

Tâche consistant à connecter une entité nommée mentionnée dans un texte à une entrée unique dans une base de connaissances (ex: un URI DBpedia ou Wikidata).

📖

termes

Corpus Annoté

Ensemble de textes où les entités ont été préalablement identifiées et étiquetées par des humains, servant de vérité terrain pour entraîner et évaluer les modèles de REN.

📖

termes

Fausse Positive en Extraction

Erreur où le système identifie incorrectement un segment de texte comme une entité pertinente, impactant négativement la précision du système de question-réponse.

📖

termes

Pipeline d'Extraction

Enchaînement séquentiel de modules (tokenisation, REN, normalisation, liaison) qui transforment un texte brut en entités structurées exploitables.

📖

termes

Système QA à Base de Connaissances

Type de système de question-réponse qui trouve des réponses en interrogeant une base de connaissances structurée, peuplée par l'extraction d'entités et de relations.

📖

termes

NER Hybride

Approche combinant des méthodes basées sur des règles (pattern matching) et des modèles d'apprentissage automatique pour tirer parti de la précision des premiers et de la flexibilité des seconds.

📖

termes

Désambiguïsation d'Entités

Tâche de résolution de l'ambiguïté lorsqu'une même chaîne de caractères peut faire référence à plusieurs entités distinctes (ex: 'Paris' la ville vs. 'Paris' le mythe).

📖

termes

Fine-Tuning pour la REN

Processus d'adaptation d'un modèle de langage pré-entraîné (comme BERT) sur un corpus spécifique pour une tâche de reconnaissance d'entités nommées.

Glossaire IA

Reconnaissance d'Entités Nommées (REN)

Extraction d'Entités

Tagging d'Entités

Dictionnaire d'Entités

Apprentissage Supervisé pour la REN

Modèle de Séquence à Séquence (Seq2Seq)

Embeddings de Contexte (ELMo, BERT)

Normalisation d'Entités

Liaison d'Entités (Entity Linking)

Corpus Annoté

Fausse Positive en Extraction

Pipeline d'Extraction

Système QA à Base de Connaissances

NER Hybride

Désambiguïsation d'Entités

Fine-Tuning pour la REN

Aucun résultat trouvé