Glossário IA
O dicionário completo da Inteligência Artificial
Padrão Regex
Expressão regular usada para descrever um padrão de busca em uma cadeia de caracteres, essencial para a extração de entidades baseadas em formatos textuais específicos.
Regra Linguística
Princípio derivado da gramática ou da sintaxe de uma língua, aplicado para restringir ou guiar a identificação de entidades em um sistema NER baseado em regras.
Gazetteer
Lista ou dicionário de referência de nomes próprios (ex: cidades, nomes próprios) usado por sistemas NER para validar ou reconhecer entidades por simples busca textual.
Regra Baseada em Janela
Tipo de regra que examina um token e seu contexto imediato (janela de palavras) para decidir se ele constitui uma entidade, baseando-se em palavras ou rótulos específicos.
Ambiguidade Nominal
Fenômeno onde um mesmo termo pode designar diferentes tipos de entidades (ex: 'Paris' como cidade ou pessoa), representando um desafio para sistemas NER baseados em regras.
Regra de Contexto Esquerdo/Direito
Regra que identifica uma entidade em função de palavras ou padrões específicos que aparecem imediatamente antes (contexto esquerdo) ou depois (contexto direito) do candidato.
Normalização Textual
Pré-processamento que limpa e padroniza o texto (ex: remoção de pontuação, conversão para minúsculas) para melhorar a eficácia dos padrões regex e das regras linguísticas.
Regra de Capitalização
Regra heurística que explora as letras maiúsculas para identificar entidades potenciais, como nomes próprios ou inícios de frase.
Expressão de Padrão
Formalização de uma regra de busca, muitas vezes mais complexa do que uma simples regex, podendo incluir restrições sobre as etiquetas gramaticais ou a estrutura das frases.
Desambiguação
Processo de resolução da ambiguidade para determinar o tipo de entidade correto quando um candidato pode pertencer a vários, muitas vezes através de regras hierarquizadas.
Regra de Exclusão
Regra que especifica condições que, se satisfeitas, impedem que um segmento de texto seja rotulado como uma entidade, reduzindo assim os falsos positivos.