Glossário IA
O dicionário completo da Inteligência Artificial
Árvore CF (Árvore de Característica de Agrupamento)
Estrutura de dados em árvore no cerne do BIRCH, armazenando resumos estatísticos (Características de Agrupamento) em seus nós para representar de forma compacta subclusters.
Característica de Agrupamento (CF)
Um tripleto (N, LS, SS) que resume estatisticamente um subcluster, onde N é o número de pontos, LS a soma linear dos pontos e SS a soma dos quadrados dos pontos.
Limiar de diâmetro (Threshold)
Parâmetro BIRCH definindo o diâmetro máximo de um subcluster em uma folha da árvore CF, controlando a granularidade do resumo de agrupamento.
Fator de ramificação (Branching Factor)
Parâmetro que limita o número de entradas (filhos) por nó na árvore CF, influenciando o tamanho e a forma da árvore para otimizar o desempenho.
Micro-agrupamento
Fase inicial do BIRCH onde os pontos de dados são organizados em micro-clusters, representados pelas entradas das folhas da árvore CF.
Macro-agrupamento
Fase final do BIRCH aplicando um algoritmo de agrupamento (como K-Means) nos micro-clusters (folhas da árvore CF) para gerar os clusters finais.
Resumo incremental
Capacidade do BIRCH de atualizar a árvore CF com novos pontos de dados sem a necessidade de recálculo completo desde o início, ideal para fluxos de dados.
Distância aditiva CF (CF Additive Distance)
Métrica de distância utilizada no BIRCH para medir a proximidade entre duas Características de Agrupamento, calculável diretamente a partir de seus resumos estatísticos sem acessar os pontos originais.
Entrada de Folha (Leaf Entry)
Elemento de uma folha da árvore CF representando um micro-cluster, contendo uma Característica de Agrupamento (Clustering Feature) e um ponteiro para o próximo nó na lista encadeada de folhas.
Lista Encadeada de Folhas (Leaf Linked List)
Estrutura na árvore CF que conecta todas as folhas para uma varredura sequencial eficiente durante a fase de macro-agrupamento.
Absorção de um Ponto (Point Absorption)
Processo no BIRCH onde um novo ponto de dados é integrado no micro-cluster mais próximo se a adição não exceder o limiar de diâmetro.
Divisão de um Nó (Node Splitting)
Mecanismo acionado no BIRCH quando a inserção de um ponto faria com que o limiar de diâmetro ou o fator de ramificação fosse excedido, dividindo o nó para manter as restrições.
Fase de Reconstrução (Rebuilding Phase)
Etapa opcional no BIRCH onde a árvore CF é reconstruída com um limiar de diâmetro menor para aumentar a precisão do agrupamento antes da fase final.
Custo de Computação Incremental
Vantagem chave do BIRCH, onde o custo para inserir um ponto de dados é logarítmico em relação ao número de pontos, tornando o algoritmo altamente escalável.
Resumo de Cluster (Cluster Summary)
Conceito fundamental do BIRCH onde um grupo de pontos é representado por um resumo estatístico (o CF) em vez de pelos pontos individuais, reduzindo o espaço de memória.