Glossário IA
O dicionário completo da Inteligência Artificial
Importância da Característica
Métrica que quantifica a influência de cada variável preditiva no desempenho de um modelo Random Forest, calculada pela redução média da impureza ou por permutação aleatória.
Importância de Gini
Método de avaliação da importância das variáveis baseado na diminuição total da impureza de Gini acumulada em todos os nós onde a variável é usada para dividir.
Diminuição Média da Impureza
Técnica que mede a importância de uma variável pela redução média da impureza (Gini ou entropia) que ela proporciona quando usada como critério de divisão nas árvores.
Importância por Permutação
Método agnóstico ao modelo que avalia a importância de uma variável medindo a degradação do desempenho do modelo quando os valores dessa variável são permutados aleatoriamente.
Diminuição Média da Acurácia
Indicador da importância de uma variável baseado na queda média da precisão do modelo quando essa variável é permutada nos dados out-of-bag.
Medida de Impureza
Função matemática que quantifica o grau de heterogeneidade das classes em um nó, utilizada para otimizar as divisões nas árvores de decisão.
Ganho de Informação
Critério de divisão que mede a redução de entropia obtida ao particionar um nó de acordo com uma característica específica, favorecendo as divisões que maximizam a homogeneidade resultante.
Índice de Gini
Medida de impureza que calcula a probabilidade de uma observação classificada aleatoriamente estar incorreta, avaliando a heterogeneidade das classes em um nó de árvore de decisão.
Erro Out-of-Bag
Estimativa de erro não enviesada calculada avaliando cada árvore nas observações não utilizadas durante seu treinamento, servindo como validação cruzada interna em Random Forest.
Seleção de Features
Processo de identificação e retenção das variáveis mais relevantes com base em seus scores de importância, eliminando features redundantes ou não informativas.
Gráfico de Importância de Variáveis
Visualização que ordena as variáveis preditivas de acordo com seu score de importância decrescente, facilitando a interpretação dos fatores mais influentes do modelo.
Gráfico de Dependência Parcial
Representação gráfica que mostra o efeito marginal de uma ou duas variáveis na previsão do modelo, ao fazer a média sobre todas as outras variáveis.
Impureza do Nó
Grau de heterogeneidade das observações em um nó de árvore, servindo de base para o cálculo da importância das features através de sua contribuição para a redução dessa impureza.
Critério de Divisão
Regra que determina a divisão ótima de um nó em função de uma feature e de um limiar, impactando diretamente a distribuição da importância entre as variáveis.