Glossário IA
O dicionário completo da Inteligência Artificial
Comprimento do Caminho
Número de divisões necessárias para isolar um ponto de dados específico da raiz à folha em uma árvore de isolamento. Comprimentos de caminho mais curtos indicam observações potencialmente anômalas.
Construção da Floresta
Processo de criação de múltiplas árvores de isolamento independentes usando diferentes subamostras aleatórias dos dados de treinamento. O desempenho aumenta com o número de árvores até um certo limiar.
Comprimento Médio do Caminho
Média dos comprimentos de caminho de um ponto de dados através de todas as árvores da floresta de isolamento. Serve como base para calcular a pontuação final de anomalia da observação.
Função de Pontuação de Anomalia
Fórmula matemática que transforma o comprimento médio do caminho em uma pontuação normalizada, levando em consideração o tamanho da amostra e a estrutura teórica da árvore. Produz uma interpretação probabilística da anomalia.
iTree
Abreviação para Isolation Tree, designando uma árvore individual em uma floresta de isolamento. Cada iTree é construída sobre uma subamostra aleatória e usa divisões aleatórias para isolar as observações.
Tamanho da Subamostra
Número de observações usadas para construir cada árvore individual na floresta, tipicamente fixado em 256 por razões de desempenho estatístico. Afeta o equilíbrio entre eficiência computacional e qualidade de detecção.
Detecção de Outliers
Processo de identificação de observações que se desviam significativamente do comportamento normal esperado em um conjunto de dados. A Isolation Forest se destaca nesta tarefa graças à sua abordagem de isolamento baseada na estrutura.
Detecção de Anomalias Não Supervisionada
Abordagem de aprendizado de máquina que identifica anomalias sem a necessidade de rótulos de treinamento, baseando-se apenas na distribuição intrínseca dos dados. A Isolation Forest é um exemplo paradigmático deste método.
Altura da árvore
Comprimento máximo do caminho da raiz até qualquer folha em uma árvore de isolamento. As anomalias tendem a ser isoladas em folhas mais próximas da raiz com alturas de árvore menores.
Particionamento aleatório
Estratégia de construção de árvores que utiliza divisões aleatórias sem otimização específica, ao contrário das árvores de decisão clássicas. Essa simplicidade torna o algoritmo eficiente para isolar anomalias rapidamente.