Glosario IA
El diccionario completo de la Inteligencia Artificial
K-means
Algoritmo de aprendizaje no supervizado que particiona un conjunto de datos en K clústeres minimizando la suma de las distancias intra-clúster, donde cada clúster está representado por su centroide.
Centroide
Punto geométrico que representa el centro de un clúster, calculado como el promedio de todos los puntos de datos pertenecientes a ese clúster y sirve como referencia para la asignación de nuevas observaciones.
Inercia intra-clúster
Medida que cuantifica la dispersión de los puntos dentro de un mismo clúster, calculada como la suma de las distancias cuadradas entre cada punto y su centroide respectivo.
Método del codo
Técnica heurística para determinar el número óptimo de clústeres K trazando la inercia intra-clúster en función de K e identificando el punto donde la reducción de inercia comienza a disminuir significativamente.
K-means++
Variante de inicialización de K-means que selecciona inteligentemente los centroides iniciales utilizando una distribución de probabilidad basada en las distancias, mejorando la convergencia y la calidad del clustering.
Convergencia
Estado alcanzado cuando los centroides no se mueven significativamente entre iteraciones sucesivas o cuando la asignación de puntos a los clústeres se vuelve estable, indicando que el algoritmo ha encontrado una solución.
Puntuación de silueta
Métrica de evaluación del clustering que mide la cohesión intra-clúster y la separación inter-clúster, variando de -1 (mal clustering) a +1 (clustering óptimo).
Óptimo local
Solución de clustering donde no es posible ninguna mejora mediante simples reasignaciones de puntos, pero que no representa necesariamente la mejor configuración global posible.
Mini-batch K-means
Variante de K-means utilisant des sous-ensembles aléatoires de données (mini-batch) pour mettre à jour les centroïdes, offrant une convergence plus rapide sur de grands ensembles de données.
Inertie inter-cluster
Mesure de séparation entre les clusters, calculée comme la somme pondérée des distances carrées entre les centroïdes des différents clusters et le centroïde global.
Vector quantization
Application du clustering K-means pour compresser des données vectorielles en représentant des groupes de vecteurs similaires par leur centroïde commun, réduisant ainsi la complexité de l'information.
Itération K-means
Cycle complet de l'algorithme comprenant la phase d'affectation des points au centroïde le plus proche et la phase de mise à jour des centroïdes basée sur la moyenne des points assignés.
Partitionnement
Approche fondamentale du clustering K-means visant à créer une division disjointe des données où chaque observation appartient exactement à un seul cluster.
Stabilité du clustering
Mesure de la cohérence des résultats de clustering obtenus par K-means lors d'exécutions multiples avec différentes initialisations, évaluant la robustesse de la solution trouvée.