Glossário IA
O dicionário completo da Inteligência Artificial
K-means
Algoritmo de aprendizagem não supervisionada que particiona um conjunto de dados em K clusters, minimizando a soma das distâncias intra-cluster, onde cada cluster é representado pelo seu centróide.
Centroïde
Ponto geométrico que representa o centro de um cluster, calculado como a média de todos os pontos de dados pertencentes a esse cluster e servindo como referência para a atribuição de novas observações.
Inertie intra-cluster
Inércia intra-cluster: Medida que quantifica a dispersão dos pontos dentro de um mesmo cluster, calculada como a soma das distâncias quadradas entre cada ponto e seu respectivo centróide.
Méthode du coude
Método do cotovelo: Técnica heurística para determinar o número ótimo de clusters K, plotando a inércia intra-cluster em função de K e identificando o ponto onde a redução da inércia começa a diminuir significativamente.
K-means++
Variante de inicialização do K-means que seleciona inteligentemente os centróides iniciais usando uma distribuição de probabilidade baseada nas distâncias, melhorando a convergência e a qualidade do clustering.
Convergence
Convergência: Estado alcançado quando os centróides não se movem mais significativamente entre iterações sucessivas ou quando a atribuição de pontos aos clusters se torna estável, indicando que o algoritmo encontrou uma solução.
Score de silhouette
Pontuação de silhueta: Métrica de avaliação de clustering que mede a coesão intra-cluster e a separação inter-cluster, variando de -1 (clustering ruim) a +1 (clustering ótimo).
Local optimum
Ótimo local: Solução de clustering onde nenhuma melhoria é possível por simples realocações de pontos, mas que não representa necessariamente a melhor configuração global possível.
Mini-batch K-means
Variante do K-means que utiliza subconjuntos aleatórios de dados (mini-batch) para atualizar os centróides, oferecendo uma convergência mais rápida em grandes conjuntos de dados.
Inércia inter-cluster
Medida de separação entre os clusters, calculada como a soma ponderada das distâncias quadradas entre os centróides dos diferentes clusters e o centróide global.
Quantização vetorial
Aplicação do clustering K-means para comprimir dados vetoriais representando grupos de vetores semelhantes pelo seu centróide comum, reduzindo assim a complexidade da informação.
Iteração K-means
Ciclo completo do algoritmo compreendendo a fase de atribuição dos pontos ao centróide mais próximo e a fase de atualização dos centróides baseada na média dos pontos atribuídos.
Particionamento
Abordagem fundamental do clustering K-means que visa criar uma divisão disjunta dos dados onde cada observação pertence exatamente a um único cluster.
Estabilidade do clustering
Medida da coerência dos resultados de clustering obtidos pelo K-means durante execuções múltiplas com diferentes inicializações, avaliando a robustez da solução encontrada.