Glossário IA
O dicionário completo da Inteligência Artificial
Árvore de Isolamento
Estrutura hierárquica binária utilizada na Isolation Forest para particionar aleatoriamente o espaço dos dados até o isolamento completo de cada observação.
Profundidade da Partição
Número de divisões necessárias para isolar uma observação particular da raiz até a folha em uma árvore de isolamento.
Comprimento do Caminho
Comprimento do caminho percorrido por uma observação através de uma árvore de isolamento, medido como o número de arestas atravessadas da raiz à folha.
Subamostragem
Técnica de amostragem aleatória utilizada na Isolation Forest para selecionar um subconjunto de dados durante a construção de cada árvore, reduzindo o viés e melhorando a eficiência.
Taxa de Contaminação
Parâmetro da Isolation Forest que define a proporção esperada de anomalias no conjunto de dados, utilizado para determinar o limiar de classificação.
Classificação de Uma Classe
Problema de aprendizado supervisionado onde o objetivo é detectar observações que não pertencem à classe majoritária, tipicamente usado para detecção de anomalias.
Particionamento Aleatório
Estratégia de divisão dos nós na Isolation Forest onde uma característica e um valor de separação são escolhidos aleatoriamente, ao contrário dos critérios otimizados das árvores de decisão clássicas.
Eficiência de Isolamento
Capacidade do algoritmo de isolar rapidamente as anomalias com caminhos curtos em comparação com as observações normais que requerem partições mais profundas.
Comprimento Médio do Caminho
Média dos comprimentos de caminho de uma observação através de todas as árvores da floresta, normalizada para fornecer uma medida comparável entre diferentes conjuntos de dados.
Construção da Floresta
Processo de criação da coleção de árvores de isolamento, treinando cada árvore em um subconjunto aleatório diferente dos dados de treinamento.
Pontuação de Isolamento
Valor normalizado entre 0 e 1 calculado a partir da profundidade média de isolamento, onde valores mais altos indicam uma maior probabilidade de ser uma anomalia.
Particionamento do Espaço de Características
Divisão recursiva do espaço multidimensional de características em regiões hiperretangulares para isolar individualmente cada observação.
Detecção de Anomalias Baseada em Árvores
Abordagem de detecção de anomalias que utiliza estruturas de árvore para modelar a distribuição dos dados e identificar observações desviantes.
Isolamento do Nó Folha
Condição terminal em uma árvore de isolamento onde uma observação está sozinha em um nó folha, marcando o fim do processo de isolamento.
Detecção de Anomalias Não Supervisionada
Paradigma de aprendizado onde o algoritmo identifica anomalias sem a necessidade de rótulos, baseando-se unicamente na estrutura inerente dos dados.
Método de Ensemble
Técnica de aprendizado de máquina que combina múltiplos modelos (árvores) para melhorar a robustez e a generalização das previsões de detecção de anomalias.
Limite de Anomalia
Valor limite da pontuação de anomalia que separa observações normais de anomalias, geralmente determinado de acordo com a taxa de contaminação especificada.