Glossário IA
O dicionário completo da Inteligência Artificial
Árvore de decisão aleatória
Estrutura em árvore gerada aleatoriamente onde cada nó divide o espaço de características de acordo com uma divisão aleatória, criando partições que isolam progressivamente as observações.
Pontuação de anomalia
Métrica quantitativa calculada a partir do comprimento do caminho na árvore, indicando o grau de anormalidade de uma observação onde uma pontuação elevada corresponde a uma alta probabilidade de ser uma anomalia.
Caminho de isolamento
Número de divisões necessárias desde a raiz até a folha contendo uma observação, onde as anomalias apresentam caminhos significativamente mais curtos que os pontos normais.
Fator de contaminação
Parâmetro crucial que estima a proporção esperada de anomalias no conjunto de dados, geralmente entre 0.01 e 0.1, influenciando o limiar de classificação.
Comprimento médio do caminho
Valor teórico esperado do caminho de isolamento para dados não estruturados, usado como referência para normalizar as pontuações de anomalia no cálculo final.
Divisão aleatória de características
Seleção aleatória de uma característica e um valor de separação em cada nó, evitando vieses relacionados às distribuições de características e favorecendo o isolamento de anomalias.
Pontuação de normalidade
Transformação da pontuação de anomalia em uma escala normalizada, frequentemente entre 0 e 1, facilitando a interpretação e comparação entre diferentes modelos ou conjuntos de dados.
Anomalia pontual
Observação individual que se desvia significativamente do comportamento esperado dos dados, facilmente identificável por seu curto comprimento de caminho de isolamento no algoritmo.
Particionamento recursivo
Processo iterativo de divisão do espaço de dados em sub-regiões cada vez menores, criando uma estrutura hierárquica que isola efetivamente as observações aberrantes.
Limiar de detecção
Valor limite determinado pelo fator de contaminação que separa as observações normais das anomalias, calculada a partir da distribuição dos escores de anomalia no conjunto de dados.
Caixa delimitadora
Hiperrreto multidimensional criado a cada divisão da árvore, definindo os limites da partição e permitindo calcular eficientemente os caminhos de isolamento.
Fator de localização aberrante
Métrica alternativa de detecção de anomalia baseada na densidade local, frequentemente comparada à Isolation Forest para avaliar o desempenho em diferentes tipos de distribuições de dados.
Poda de árvore
Técnica de limitação do crescimento das árvores parando a divisão quando os nós contêm uma única amostra ou atingem a profundidade máxima, otimizando os tempos de computação.