Importância e seleção de características

📖

termos

Ganho de Impureza (Impurity Gain)

Critério de seleção de variável em árvores de decisão que mede a redução da impureza (ex: índice de Gini ou entropia) proporcionada pela divisão de um nó de acordo com uma característica dada.

📖

termos

Peso de Gini (Gini Importance)

Medida de importância específica para florestas aleatórias, calculada como a redução média da impureza de Gini proporcionada por uma variável em todas as árvores da floresta.

📖

termos

Recursividade de Característica (Feature Recursion)

Conceito em modelos baseados em árvores onde a importância de uma variável é influenciada pela sua capacidade de ser selecionada em vários níveis de profundidade, incluindo em sub-árvores criadas por outras variáveis.

📖

termos

Importância por Redução de Erro (Drop Column Importance)

Método de avaliação de importância que consiste em re-treinar o modelo após remover uma variável e medir a degradação de seu desempenho em comparação com o modelo de referência completo.

📖

termos

Valor SHAP (SHAP Value)

Pontuação quantitativa atribuída pelo método SHAP a uma característica para uma previsão individual, representando sua contribuição marginal para a diferença entre a previsão do modelo e a previsão média do conjunto de dados.

📖

termos

Gráfico de Força SHAP (SHAP Force Plot)

Visualização específica do SHAP que ilustra como os valores SHAP de cada característica impulsionam a previsão do modelo do valor base (médio) para o valor de saída final para uma observação única.

📖

termos

Importância Global vs. Local

Distinção fundamental em interpretabilidade onde a importância global avalia o impacto de uma variável no modelo como um todo, enquanto a importância local explica sua contribuição para uma previsão específica.

📖

termos

Seleção de Variáveis por Importância

Processo de redução de dimensionalidade que utiliza as pontuações de importância das características para eliminar variáveis não pertinentes ou redundantes, visando melhorar o desempenho e a interpretabilidade do modelo.

📖

termos

Coeficientes de Regressão LASSO

No contexto da seleção, os coeficientes de um modelo LASSO (Least Absolute Shrinkage and Selection Operator) servem como um indicador de importância, pois a penalização L1 pode reduzir alguns coeficientes a exatamente zero, eliminando assim as variáveis correspondentes.

📖

termos

Importância por Substitutos (Surrogate Importance)

Método de avaliação da importância em modelos baseados em árvores que mede a capacidade de uma variável de servir como substituto (surrogate split) para a variável de divisão principal para particionar os dados, indicando uma informação redundante, mas relevante.

📖

termos

Importância por Análise de Sensibilidade (Sensitivity Analysis)

Abordagem que avalia a importância de uma variável analisando como as variações de seus valores influenciam a saída do modelo, muitas vezes pelo cálculo de derivadas parciais ou por simulações de Monte Carlo.

Glossário IA

Ganho de Impureza (Impurity Gain)

Peso de Gini (Gini Importance)

Recursividade de Característica (Feature Recursion)

Importância por Redução de Erro (Drop Column Importance)

Valor SHAP (SHAP Value)

Gráfico de Força SHAP (SHAP Force Plot)

Importância Global vs. Local

Seleção de Variáveis por Importância

Coeficientes de Regressão LASSO

Importância por Substitutos (Surrogate Importance)

Importância por Análise de Sensibilidade (Sensitivity Analysis)

Nenhum resultado encontrado