Glossário IA
O dicionário completo da Inteligência Artificial
DBSCAN
Algoritmo de clustering baseado em densidade que agrupa pontos suficientemente próximos, marcando como outliers os pontos isolados em regiões de baixa densidade.
Epsilon (ε)
Parâmetro que define o raio da vizinhança ao redor de um ponto para determinar se pertence a um cluster, influenciando diretamente a granularidade do clustering.
MinPts
Parâmetro limiar que define o número mínimo de pontos necessários na vizinhança ε para que um ponto seja considerado um ponto core.
Point Core
Ponto central de um cluster com pelo menos MinPts pontos em sua vizinhança ε, servindo como ponto de âncora para formar clusters densos.
Point Border
Ponto localizado na periferia de um cluster, não tendo vizinhos suficientes para ser um ponto core, mas sendo alcançável a partir de um ponto core.
Point Noise
Ponto que não pertence a nenhum cluster, pois não é um ponto core nem é alcançável a partir de um ponto core, sendo frequentemente considerado uma anomalia.
Voisinage ε
Conjunto de pontos localizados a uma distância menor ou igual a ε de um ponto dado, formando a base para o cálculo de densidade no DBSCAN.
Densité-directement atteignable
Relação onde um ponto q é diretamente acessível a partir de um ponto core p se q estiver na vizinhança ε de p.
Alcançável por densidade
Relação transitiva onde um ponto é alcançável a partir de um ponto central através de uma cadeia de pontos diretamente alcançáveis por densidade.
Conectado por densidade
Relação simétrica onde dois pontos estão conectados se existe um ponto central comum do qual ambos são alcançáveis por densidade.
OPTICS
Algoritmo que estende o DBSCAN e produz uma ordenação de agrupamento baseada em densidade, permitindo extrair clusters de densidades variáveis.
HDBSCAN
Variante hierárquica do DBSCAN que constrói uma hierarquia de clusters de densidades variáveis e seleciona automaticamente os clusters estáveis.
Índice R-tree
Estrutura de dados de indexação espacial que otimiza a busca por vizinhos em um raio ε, acelerando significativamente o DBSCAN em grandes conjuntos de dados.
Maldição da Dimensionalidade
Fenômeno onde a medida de distância perde seu significado em espaços de alta dimensão, afetando o desempenho dos algoritmos baseados em densidade.
Pontuação Silhouette
Métrica de avaliação que mede a coesão intra-cluster e a separação inter-cluster, usada para otimizar os parâmetros ε e MinPts.
Clusters de forma arbitrária
Vantagem principal do DBSCAN que permite detectar clusters não convexos e de formas complexas, ao contrário de algoritmos como K-means.
Detecção de anomalias
Aplicação natural do DBSCAN onde os pontos identificados como ruído correspondem a anomalias ou outliers nos dados.
Particionamento espacial
Processo de divisão do espaço de dados em regiões baseadas na densidade, fundamento do funcionamento do DBSCAN e algoritmos similares.
Grafo de vizinhança
Representação gráfica onde os nós são os pontos e as arestas conectam os pontos na vizinhança ε, usada para visualizar a estrutura de densidade.
Distância de alcançabilidade
Distância modificada usada em OPTICS e HDBSCAN que leva em conta a densidade local para ordenar os pontos segundo sua alcançabilidade.
Distância central
Distância mínima necessária para que um ponto se torne um ponto central, calculada como a distância ao MinPts-ésimo vizinho mais próximo.