Glossário IA
O dicionário completo da Inteligência Artificial
Seleção Aleatória de Características
Técnica introduzida no Random Forest onde cada árvore de decisão é treinada em um subconjunto aleatório das características (features) a cada divisão, reduzindo a correlação entre as árvores e melhorando a generalização.
Importância das Características
Métrica calculada no Random Forest que avalia a contribuição de cada variável para a precisão do modelo, geralmente medida pela diminuição média da impureza (Gini ou entropia) ou o aumento do erro OOB quando a variável é permutada.
Agregação por Voto Majoritário
Método de agregação para problemas de classificação onde a previsão final do conjunto é a classe que recebe o maior número de votos entre as previsões individuais dos modelos base.
Floresta Aleatória Extrema (Extremely Randomized Trees)
Variante do Random Forest que introduz mais aleatoriedade ao escolher os limiares de divisão das características de forma completamente aleatória, em vez de procurar o limiar ótimo, reduzindo o viés e a variância.
Proximidade entre Observações
Matriz de similaridade calculada no Random Forest que conta o número de vezes que duas observações se encontram na mesma folha terminal em todas as árvores da floresta, podendo ser utilizada para detecção de anomalias ou clustering.