Resposta a Perguntas por Extração de Entidades

📖

termos

Reconhecimento de Entidades Nomeadas (REN)

Subtarefa do Processamento de Linguagem Natural (PLN) que visa identificar e classificar entidades predefinidas como pessoas, organizações ou locais em um texto não estruturado.

📖

termos

Extração de Entidades

Processo de identificação e isolamento de informações estruturadas específicas (entidades) a partir de dados textuais não estruturados para alimentar uma base de conhecimento.

📖

termos

Marcação de Entidades

Ação de associar rótulos (tags) semânticos às entidades extraídas de um texto, permitindo sua classificação e uso em sistemas de perguntas e respostas.

📖

termos

Dicionário de Entidades

Base de dados ou lista estruturada contendo as entidades válidas e seus tipos, utilizada como referência para reconhecimento e validação em um sistema QA.

📖

termos

Aprendizagem Supervisionada para REN

Abordagem onde um modelo de REN é treinado em um corpus textual anotado manualmente para aprender a reconhecer e classificar as entidades.

📖

termos

Modelo de Sequência para Sequência (Seq2Seq)

Arquitetura de rede neural usada para tarefas complexas de REN, processando uma sequência de entrada (texto) para produzir uma sequência de saída (rótulos de entidades).

📖

termos

Embeddings de Contexto (ELMo, BERT)

Representações vetoriais de palavras que capturam seu significado com base no contexto circundante, melhorando significativamente a precisão da extração de entidades ambíguas.

📖

termos

Normalização de Entidades

Processo de padronização das entidades extraídas (ex: transformar 'Terça-feira', 'ter.' e 'Terça' em uma forma canônica) para garantir a consistência dos dados.

📖

termos

Vinculação de Entidades (Entity Linking)

Tarefa que consiste em conectar uma entidade nomeada mencionada num texto a uma entrada única numa base de conhecimento (ex: um URI DBpedia ou Wikidata).

📖

termos

Corpus Anotado

Conjunto de textos onde as entidades foram previamente identificadas e rotuladas por humanos, servindo de verdade fundamental para treinar e avaliar modelos de REN.

📖

termos

Falso Positivo na Extração

Erro em que o sistema identifica incorretamente um segmento de texto como uma entidade relevante, impactando negativamente a precisão do sistema de perguntas e respostas.

📖

termos

Pipeline de Extração

Sequência de módulos (tokenização, REN, normalização, vinculação) que transformam um texto bruto em entidades estruturadas utilizáveis.

📖

termos

Sistema QA Baseado em Conhecimento

Tipo de sistema de perguntas e respostas que encontra respostas consultando uma base de conhecimento estruturada, preenchida pela extração de entidades e relações.

📖

termos

NER Híbrido

Abordagem que combina métodos baseados em regras (correspondência de padrões) e modelos de aprendizado de máquina para aproveitar a precisão dos primeiros e a flexibilidade dos segundos.

📖

termos

Desambiguação de Entidades

Tarefa de resolução da ambiguidade quando uma mesma cadeia de caracteres pode referir-se a várias entidades distintas (ex: 'Paris' a cidade vs. 'Paris' o mito).

📖

termos

Fine-Tuning para REN

Processo de adaptação de um modelo de linguagem pré-treinado (como BERT) num corpus específico para uma tarefa de reconhecimento de entidades nomeadas.

Glossário IA

Reconhecimento de Entidades Nomeadas (REN)

Extração de Entidades

Marcação de Entidades

Dicionário de Entidades

Aprendizagem Supervisionada para REN

Modelo de Sequência para Sequência (Seq2Seq)

Embeddings de Contexto (ELMo, BERT)

Normalização de Entidades

Vinculação de Entidades (Entity Linking)

Corpus Anotado

Falso Positivo na Extração

Pipeline de Extração

Sistema QA Baseado em Conhecimento

NER Híbrido

Desambiguação de Entidades

Fine-Tuning para REN

Nenhum resultado encontrado