K-means e variantes centroides

📖

termos

Centroide

Ponto central de um cluster calculado como a média aritmética de todos os pontos pertencentes a esse cluster. O centroide serve como representante do cluster e é usado para atribuir novas observações.

📖

termos

K-medoides

Variante do K-means onde o centro de cada cluster deve ser um ponto de dados existente em vez de uma média calculada. Esta abordagem é mais robusta a outliers e dados categóricos.

📖

termos

Inércia intra-cluster

Medida da compacidade dos clusters calculada como a soma das distâncias quadradas entre cada ponto e seu centroide. O objetivo do K-means é minimizar esta inércia global.

📖

termos

Algoritmo de Lloyd

Nome alternativo do algoritmo K-means padrão, composto por duas etapas iterativas: atribuição dos pontos ao centroide mais próximo e recálculo dos centroides como a média dos pontos atribuídos.

📖

termos

Particionamento

Processo de divisão de um conjunto de dados em subconjuntos disjuntos onde cada elemento pertence a exatamente um cluster. O K-means realiza um particionamento rígido em oposição ao agrupamento difuso.

📖

termos

K-modes

Extensão do K-means adaptada a dados categóricos utilizando dissimilaridade simples em vez da distância euclidiana. Os modos (valores mais frequentes) substituem as médias como centroides.

📖

termos

Fuzzy C-means

Variante do K-means onde cada ponto pode pertencer a vários clusters com diferentes graus de pertinência. Esta abordagem difusa é útil quando as fronteiras entre clusters são mal definidas.

📖

termos

Gap statistic

Método estatístico para determinar o número ótimo de clusters comparando a inércia intra-cluster observada com a esperada sob uma distribuição de referência nula. O k ótimo maximiza a lacuna (gap).

📖

termos

X-means

Extensão do K-means que determina automaticamente o número ótimo de clusters k usando critérios de informação como BIC ou AIC. O algoritmo testa sucessivamente diferentes valores de k.

📖

termos

G-means

Algoritmo baseado no K-means que determina automaticamente o número de clusters testando a hipótese de normalidade multivariada dos dados projetados na linha que conecta o centroide aos seus pontos.

Glossário IA

Centroide

K-medoides

Inércia intra-cluster

Algoritmo de Lloyd

Particionamento

K-modes

Fuzzy C-means

Gap statistic

X-means

G-means

Nenhum resultado encontrado