Glossário IA
O dicionário completo da Inteligência Artificial
Reconhecimento de Entidades Nomeadas (REN)
Subtarefa do Processamento de Linguagem Natural (PLN) que visa identificar e classificar entidades predefinidas como pessoas, organizações ou locais em um texto não estruturado.
Extração de Entidades
Processo de identificação e isolamento de informações estruturadas específicas (entidades) a partir de dados textuais não estruturados para alimentar uma base de conhecimento.
Marcação de Entidades
Ação de associar rótulos (tags) semânticos às entidades extraídas de um texto, permitindo sua classificação e uso em sistemas de perguntas e respostas.
Dicionário de Entidades
Base de dados ou lista estruturada contendo as entidades válidas e seus tipos, utilizada como referência para reconhecimento e validação em um sistema QA.
Aprendizagem Supervisionada para REN
Abordagem onde um modelo de REN é treinado em um corpus textual anotado manualmente para aprender a reconhecer e classificar as entidades.
Modelo de Sequência para Sequência (Seq2Seq)
Arquitetura de rede neural usada para tarefas complexas de REN, processando uma sequência de entrada (texto) para produzir uma sequência de saída (rótulos de entidades).
Embeddings de Contexto (ELMo, BERT)
Representações vetoriais de palavras que capturam seu significado com base no contexto circundante, melhorando significativamente a precisão da extração de entidades ambíguas.
Normalização de Entidades
Processo de padronização das entidades extraídas (ex: transformar 'Terça-feira', 'ter.' e 'Terça' em uma forma canônica) para garantir a consistência dos dados.
Vinculação de Entidades (Entity Linking)
Tarefa que consiste em conectar uma entidade nomeada mencionada num texto a uma entrada única numa base de conhecimento (ex: um URI DBpedia ou Wikidata).
Corpus Anotado
Conjunto de textos onde as entidades foram previamente identificadas e rotuladas por humanos, servindo de verdade fundamental para treinar e avaliar modelos de REN.
Falso Positivo na Extração
Erro em que o sistema identifica incorretamente um segmento de texto como uma entidade relevante, impactando negativamente a precisão do sistema de perguntas e respostas.
Pipeline de Extração
Sequência de módulos (tokenização, REN, normalização, vinculação) que transformam um texto bruto em entidades estruturadas utilizáveis.
Sistema QA Baseado em Conhecimento
Tipo de sistema de perguntas e respostas que encontra respostas consultando uma base de conhecimento estruturada, preenchida pela extração de entidades e relações.
NER Híbrido
Abordagem que combina métodos baseados em regras (correspondência de padrões) e modelos de aprendizado de máquina para aproveitar a precisão dos primeiros e a flexibilidade dos segundos.
Desambiguação de Entidades
Tarefa de resolução da ambiguidade quando uma mesma cadeia de caracteres pode referir-se a várias entidades distintas (ex: 'Paris' a cidade vs. 'Paris' o mito).
Fine-Tuning para REN
Processo de adaptação de um modelo de linguagem pré-treinado (como BERT) num corpus específico para uma tarefa de reconhecimento de entidades nomeadas.