Glossário IA
O dicionário completo da Inteligência Artificial
CART (Árvores de Classificação e Regressão)
Algoritmo fundamental para construir árvores de decisão utilizando o índice de Gini para classificação e a variância para regressão.
ID3 (Iterative Dichotomiser 3)
Primeiro algoritmo de árvore de decisão usando o ganho de informação como critério de divisão dos nós.
C4.5 e C5.0
Evolução do ID3 que lida com atributos contínuos e usa a razão de ganho para evitar o viés em relação a atributos com muitos valores.
Bagging (Bootstrap Aggregating)
Técnica de ensemble que cria múltiplos modelos em subamostras bootstrap, fundamento das Random Forests.
Importância da Característica
Método de avaliação da importância das variáveis baseado na redução de impureza ou na permutação em Random Forests.
Erro Out-of-Bag
Estimativa de erro sem validação cruzada utilizando as amostras não selecionadas no bootstrap de cada árvore.
Poda de Árvores (Poda)
Técnicas de redução da complexidade das árvores para evitar o sobreajuste (pré-poda e pós-poda).
Impureza de Gini
Medida da impureza de um nó que calcula a probabilidade de classificação incorreta de um elemento escolhido aleatoriamente.
Ganho de Informação e Entropia
Critérios de divisão baseados na teoria da informação, medindo a redução de entropia após uma partição.
Extra-Trees (Extremely Randomized Trees)
Variante das Random Forests com seleção aleatória dos limiares de divisão para reduzir ainda mais a variância.
Isolation Forest
Aplicação de Random Forests para a detecção de anomalias isolando as observações em árvores curtas.
Árvores de Gradiente Aumentado
Método de ensemble sequencial que constrói árvores para corrigir os erros residuais dos modelos anteriores.