Glossário IA
O dicionário completo da Inteligência Artificial
Seleção de Features
Processo de seleção automática das características mais relevantes para um modelo supervisionado, eliminando variáveis redundantes ou não informativas para melhorar o desempenho e reduzir a complexidade.
Codificação de Rótulos
Transformação de variáveis categóricas em valores numéricos inteiros onde cada categoria única recebe um identificador numérico distinto, adequado para algoritmos que necessitam de entradas numéricas.
Escalonamento de Features
Normalização ou padronização das características numéricas para trazê-las a uma faixa comparável, essencial para algoritmos sensíveis à escala das variáveis como SVMs e redes neurais.
Features Polinomiais
Geração de novas características através da criação de combinações polinomiais das variáveis existentes, permitindo capturar relações não-lineares entre as features e a variável alvo.
Features de Interação
Criação de novas variáveis representando interações entre características existentes, tipicamente por multiplicação ou combinação, para revelar efeitos sinérgicos nos dados supervisionados.
Eliminação Recursiva de Features
Algoritmo de seleção iterativa que constrói um modelo, elimina as características menos importantes segundo um critério específico, e repete este processo até atingir o número ótimo de features.
Codificação Alvo
Técnica de transformação de variáveis categóricas utilizando estatísticas da variável alvo (média, mediana) para cada categoria, capturando assim diretamente a relação com a predição.
Importância de Features
Medida quantitativa do impacto de cada característica nas predições do modelo supervisionado, calculada por métodos como importância por permutação, valores SHAP ou coeficientes do modelo.
Análise de Componentes Principais
Técnica de redução dimensional linear que transforma as características em componentes ortogonais não correlacionados, maximizando a variância explicada com um número reduzido de dimensões.
Agrupamento/Discretização
Processo de conversão de variáveis contínuas em categorias discretas (bins) para simplificar as relações, gerenciar valores aberrantes e melhorar o desempenho de certos algoritmos supervisionados.
Hashing de Características
Técnica de dimensionalidade reduzida que aplica uma função de hash às características para mapeá-las em um espaço de dimensão fixa, útil para dados de alta dimensionalidade com muitas categorias.
Imputação de Valores Ausentes
Conjunto de estratégias estatísticas ou algorítmicas para substituir valores ausentes nas características por estimativas apropriadas, essencial para manter a integridade dos dados supervisionados.
Cruzamento de Características
Combinação de características para criar novas features representando interações específicas, particularmente eficaz em modelos lineares para capturar relações não aditivas.
Pipeline de Engenharia de Características
Sequência automatizada e reproduzível de transformações aplicadas às características, integrando limpeza, criação, seleção e escalonamento para garantir a consistência entre treinamento e predição.
Criação de Características Específicas do Domínio
Desenvolvimento de características baseadas em expertise de negócios e conhecimento do domínio, criando variáveis informativas que capturam padrões específicos não óbvios nos dados brutos.
Engenharia de Características Temporais
Criação de características específicas para dados temporais como lag features, estatísticas móveis, componentes temporais e tendências sazonais para melhorar previsões supervisionadas cronológicas.