Glossário IA
O dicionário completo da Inteligência Artificial
Ganho de Impureza (Impurity Gain)
Critério de seleção de variável em árvores de decisão que mede a redução da impureza (ex: índice de Gini ou entropia) proporcionada pela divisão de um nó de acordo com uma característica dada.
Peso de Gini (Gini Importance)
Medida de importância específica para florestas aleatórias, calculada como a redução média da impureza de Gini proporcionada por uma variável em todas as árvores da floresta.
Recursividade de Característica (Feature Recursion)
Conceito em modelos baseados em árvores onde a importância de uma variável é influenciada pela sua capacidade de ser selecionada em vários níveis de profundidade, incluindo em sub-árvores criadas por outras variáveis.
Importância por Redução de Erro (Drop Column Importance)
Método de avaliação de importância que consiste em re-treinar o modelo após remover uma variável e medir a degradação de seu desempenho em comparação com o modelo de referência completo.
Valor SHAP (SHAP Value)
Pontuação quantitativa atribuída pelo método SHAP a uma característica para uma previsão individual, representando sua contribuição marginal para a diferença entre a previsão do modelo e a previsão média do conjunto de dados.
Gráfico de Força SHAP (SHAP Force Plot)
Visualização específica do SHAP que ilustra como os valores SHAP de cada característica impulsionam a previsão do modelo do valor base (médio) para o valor de saída final para uma observação única.
Importância Global vs. Local
Distinção fundamental em interpretabilidade onde a importância global avalia o impacto de uma variável no modelo como um todo, enquanto a importância local explica sua contribuição para uma previsão específica.
Seleção de Variáveis por Importância
Processo de redução de dimensionalidade que utiliza as pontuações de importância das características para eliminar variáveis não pertinentes ou redundantes, visando melhorar o desempenho e a interpretabilidade do modelo.
Coeficientes de Regressão LASSO
No contexto da seleção, os coeficientes de um modelo LASSO (Least Absolute Shrinkage and Selection Operator) servem como um indicador de importância, pois a penalização L1 pode reduzir alguns coeficientes a exatamente zero, eliminando assim as variáveis correspondentes.
Importância por Substitutos (Surrogate Importance)
Método de avaliação da importância em modelos baseados em árvores que mede a capacidade de uma variável de servir como substituto (surrogate split) para a variável de divisão principal para particionar os dados, indicando uma informação redundante, mas relevante.
Importância por Análise de Sensibilidade (Sensitivity Analysis)
Abordagem que avalia a importância de uma variável analisando como as variações de seus valores influenciam a saída do modelo, muitas vezes pelo cálculo de derivadas parciais ou por simulações de Monte Carlo.