Glossário IA
O dicionário completo da Inteligência Artificial
Índice de Silhueta
Medida de validação interna que avalia a coesão e a separação dos clusters, comparando a distância média de um ponto aos outros pontos do seu cluster em relação à sua distância média aos pontos do cluster vizinho mais próximo.
Pontuação de Davies-Bouldin
Índice de validação interna que minimiza a razão entre a dispersão intra-cluster e a distância inter-cluster, onde valores mais baixos indicam uma melhor qualidade de particionamento.
Índice de Calinski-Harabasz
Critério de avaliação baseado na razão entre a dispersão inter-clusters e a dispersão intra-clusters, onde valores mais altos sugerem clusters melhor definidos e mais separados.
Coeficiente de Silhueta Médio
Média dos coeficientes de silhueta individuais para todos os pontos do conjunto de dados, servindo como uma métrica global para avaliar a qualidade geral do agrupamento numa escala de -1 a 1.
Partição Ótima
Configuração de clusters que maximiza ou minimiza um critério de validação específico de acordo com a métrica utilizada, representando teoricamente a melhor segmentação possível dos dados.
Validação Interna
Abordagem de avaliação que utiliza apenas as informações intrínsecas aos dados para medir a qualidade do agrupamento, sem recorrer a rótulos de verdade externa.
Validação Externa
Método de avaliação que compara os resultados do agrupamento com rótulos predefinidos ou uma classificação de referência para medir a adequação do particionamento obtido.
Validação Relativa
Técnica de avaliação que compara diferentes soluções de agrupamento entre si para identificar a melhor configuração, nomeadamente para determinar o número ótimo de clusters.
Critério do Cotovelo
Método visual heurístico que identifica o número ótimo de clusters localizando o ponto de inflexão onde a adição de clusters adicionais não traz mais melhorias significativas.
Índice de Dunn
Métrica de validação interna que calcula a razão entre a distância mínima inter-clusters e o diâmetro máximo intra-cluster, onde valores altos indicam melhor separação.
Índice de Rand Ajustado
Medida de similaridade entre duas partições de dados, corrigida para o acaso, avaliando a concordância de pares de observações classificadas juntas ou separadamente nas duas segmentações.
Índice de Jaccard
Coeficiente que mede a similaridade entre dois conjuntos calculando a razão entre sua interseção e sua união, adaptado para comparar resultados de clustering.
Pureza do Cluster
Métrica de validação externa que mede o grau em que cada cluster contém elementos de uma única classe dominante, com valores próximos de 1 indicando clusters puros.
Entropia de Clustering
Medida que quantifica a desordem ou incerteza na distribuição das classes dentro de cada cluster, onde valores baixos indicam melhor homogeneidade.
Score de Estabilidade
Métrica que avalia a robustez de uma solução de clustering medindo sua consistência em execuções repetidas ou sob diferentes condições de amostragem.
Coesão Intra-cluster
Medida de compacidade que avalia o quão semelhantes ou próximos os elementos de um mesmo cluster são uns dos outros, geralmente calculada como a soma das distâncias intra-cluster.
Separação inter-cluster
Critério que mede o grau de isolamento entre diferentes clusters, quantificado pela distância mínima, média ou centroide entre os grupos distintos.