Glossário IA
O dicionário completo da Inteligência Artificial
Centroide
Ponto central de um cluster calculado como a média aritmética de todos os pontos pertencentes a esse cluster. O centroide serve como representante do cluster e é usado para atribuir novas observações.
K-medoides
Variante do K-means onde o centro de cada cluster deve ser um ponto de dados existente em vez de uma média calculada. Esta abordagem é mais robusta a outliers e dados categóricos.
Inércia intra-cluster
Medida da compacidade dos clusters calculada como a soma das distâncias quadradas entre cada ponto e seu centroide. O objetivo do K-means é minimizar esta inércia global.
Algoritmo de Lloyd
Nome alternativo do algoritmo K-means padrão, composto por duas etapas iterativas: atribuição dos pontos ao centroide mais próximo e recálculo dos centroides como a média dos pontos atribuídos.
Particionamento
Processo de divisão de um conjunto de dados em subconjuntos disjuntos onde cada elemento pertence a exatamente um cluster. O K-means realiza um particionamento rígido em oposição ao agrupamento difuso.
K-modes
Extensão do K-means adaptada a dados categóricos utilizando dissimilaridade simples em vez da distância euclidiana. Os modos (valores mais frequentes) substituem as médias como centroides.
Fuzzy C-means
Variante do K-means onde cada ponto pode pertencer a vários clusters com diferentes graus de pertinência. Esta abordagem difusa é útil quando as fronteiras entre clusters são mal definidas.
Gap statistic
Método estatístico para determinar o número ótimo de clusters comparando a inércia intra-cluster observada com a esperada sob uma distribuição de referência nula. O k ótimo maximiza a lacuna (gap).
X-means
Extensão do K-means que determina automaticamente o número ótimo de clusters k usando critérios de informação como BIC ou AIC. O algoritmo testa sucessivamente diferentes valores de k.
G-means
Algoritmo baseado no K-means que determina automaticamente o número de clusters testando a hipótese de normalidade multivariada dos dados projetados na linha que conecta o centroide aos seus pontos.