Glossário IA
O dicionário completo da Inteligência Artificial
Erro Quadrático
Critério de divisão usado em árvores CART de regressão, minimizando a soma dos quadrados dos desvios entre os valores observados e a média prevista em cada nó filho.
Critério de Divisão Ótimo
Combinação variável-limiar selecionada entre todas as possibilidades que maximiza a redução de impureza (Gini) ou minimiza o erro quadrático para criar as partições mais homogêneas.
Complexidade Mínima
Princípio fundamental do CART que privilegia a árvore mais simples com o mesmo desempenho preditivo de uma árvore mais complexa, controlado pelo parâmetro de penalidade alfa na poda.
Matriz de Confusão CART
Tabela de avaliação específica para árvores CART de classificação, cruzando as classes previstas e reais para calcular as taxas de erro por classe e a taxa de erro global.
Variável de Divisão
Característica selecionada em cada nó para particionar os dados, escolhida entre todas as variáveis disponíveis com base em sua capacidade de maximizar a homogeneidade resultante.
Limiar Ótimo
Valor numérico contínuo que divide os dados em dois grupos, maximizando a redução da impureza de Gini ou minimizando o erro quadrático no contexto CART.
Árvore de Regressão CART
Variante CART especializada na previsão de variáveis contínuas, utilizando o erro quadrático como critério de divisão e a média como previsão nas folhas terminais.
Árvore de Classificação CART
Versão CART projetada para variáveis categóricas, utilizando o índice de Gini como medida de impureza e a classe majoritária como previsão em cada nó terminal.
Sobreajuste CART
Fenômeno em que a árvore CART se torna excessivamente complexa ao memorizar as particularidades do conjunto de treinamento, exigindo poda para melhorar a generalização em novos dados.
Amostragem CART
Processo de particionamento recursivo dos dados de treinamento em subconjuntos cada vez mais puros até atingir um critério de parada predefinido.
Validação Cruzada CART
Método de avaliação que utiliza validação cruzada V-fold para estimar o erro de generalização da árvore CART e determinar o nível de poda ideal.