Glosario IA
El diccionario completo de la Inteligencia Artificial
Reconocimiento de Entidades Nombradas (NER)
Subtarea del Procesamiento del Lenguaje Natural (PLN) que tiene como objetivo identificar y clasificar entidades predefinidas como personas, organizaciones o lugares en un texto no estructurado.
Extracción de Entidades
Proceso de identificación y aislamiento de información estructurada específica (entidades) a partir de datos textuales no estructurados para alimentar una base de conocimientos.
Etiquetado de Entidades
Acción de asociar etiquetas semánticas a las entidades extraídas de un texto, permitiendo su clasificación y uso en sistemas de pregunta-respuesta.
Diccionario de Entidades
Base de datos o lista estructurada que contiene las entidades válidas y sus tipos, utilizada como referencia para el reconocimiento y la validación en un sistema QA.
Aprendizaje Supervisado para la NER
Enfoque en el que un modelo NER se entrena en un corpus textual anotado manualmente para aprender a reconocer y clasificar las entidades.
Modelo de Secuencia a Secuencia (Seq2Seq)
Arquitectura de red neuronal utilizada para tareas NER complejas, procesando una secuencia de entrada (texto) para producir una secuencia de salida (etiquetas de entidades).
Embeddings de Contexto (ELMo, BERT)
Representaciones vectoriales de palabras que capturan su significado en función del contexto circundante, mejorando considerablemente la precisión de la extracción de entidades ambiguas.
Normalización de Entidades
Proceso de estandarización de las entidades extraídas (ej: transformar 'Martes', 'mar.' y 'martes' en una forma canónica) para garantizar la coherencia de los datos.
Liaison d'Entités (Entity Linking)
Tâche consistant à connecter une entité nommée mentionnée dans un texte à une entrée unique dans une base de connaissances (ex: un URI DBpedia ou Wikidata).
Corpus Annoté
Ensemble de textes où les entités ont été préalablement identifiées et étiquetées par des humains, servant de vérité terrain pour entraîner et évaluer les modèles de REN.
Fausse Positive en Extraction
Erreur où le système identifie incorrectement un segment de texte comme une entité pertinente, impactant négativement la précision du système de question-réponse.
Pipeline d'Extraction
Enchaînement séquentiel de modules (tokenisation, REN, normalisation, liaison) qui transforment un texte brut en entités structurées exploitables.
Système QA à Base de Connaissances
Type de système de question-réponse qui trouve des réponses en interrogeant une base de connaissances structurée, peuplée par l'extraction d'entités et de relations.
NER Hybride
Approche combinant des méthodes basées sur des règles (pattern matching) et des modèles d'apprentissage automatique pour tirer parti de la précision des premiers et de la flexibilité des seconds.
Désambiguïsation d'Entités
Tâche de résolution de l'ambiguïté lorsqu'une même chaîne de caractères peut faire référence à plusieurs entités distinctes (ex: 'Paris' la ville vs. 'Paris' le mythe).
Fine-Tuning pour la REN
Processus d'adaptation d'un modèle de langage pré-entraîné (comme BERT) sur un corpus spécifique pour une tâche de reconnaissance d'entités nommées.