Glosario IA
El diccionario completo de la Inteligencia Artificial
Índice de Silueta
Medida de validación interna que evalúa la cohesión y separación de los clústeres comparando la distancia promedio de un punto a otros puntos de su clúster con su distancia promedio a los puntos del clúster vecino más cercano.
Puntuación de Davies-Bouldin
Índice de validación interna que minimiza la relación entre la dispersión intra-clúster y la distancia inter-clúster, donde valores más bajos indican una mejor calidad de particionamiento.
Índice de Calinski-Harabasz
Criterio de evaluación basado en la relación entre la dispersión inter-clústeres y la dispersión intra-clústeres, donde valores más altos sugieren clústeres mejor definidos y más separados.
Coeficiente de silueta promedio
Promedio de los coeficientes de silueta individuales para todos los puntos del conjunto de datos, sirviendo como métrica global para evaluar la calidad general del clustering en una escala de -1 a 1.
Partición óptima
Configuración de clústeres que maximiza o minimiza un criterio de validación específico según la métrica utilizada, representando teóricamente la mejor segmentación posible de los datos.
Validación interna
Enfoque de evaluación que utiliza únicamente la información intrínseca a los datos para medir la calidad del clustering, sin recurrir a etiquetas de verdad fundamental externas.
Validación externa
Método de evaluación que compara los resultados del clustering con etiquetas predefinidas o una clasificación de referencia para medir la adecuación del particionamiento obtenido.
Validación relativa
Técnica de evaluación que compara diferentes soluciones de clustering entre sí para identificar la mejor configuración, especialmente para determinar el número óptimo de clústeres.
Criterio del Codo
Método visual heurístico que identifica el número óptimo de clústeres localizando el punto de inflexión donde la adición de clústeres adicionales ya no aporta una mejora significativa.
Índice de Dunn
Métrica de validación interna que calcula la relación entre la distancia mínima inter-clúster y el diámetro máximo intra-clúster, donde valores altos indican una mejor separación.
Índice de Rand Ajustado
Medida de similitud entre dos particiones de datos, corregida por el azar, que evalúa la concordancia de pares de observaciones clasificadas juntas o separadas en ambas segmentaciones.
Índice de Jaccard
Coeficiente que mide la similitud entre dos conjuntos calculando la relación entre su intersección y su unión, adaptado para comparar resultados de clustering.
Pureza del Clúster
Métrica de validación externa que mide el grado en que cada clúster contiene elementos de una única clase dominante, con valores cercanos a 1 indicando clústeres puros.
Entropía de Clustering
Medida que cuantifica el desorden o la incertidumbre en la distribución de clases dentro de cada clúster, donde valores bajos indican una mejor homogeneidad.
Puntuación de Estabilidad
Métrica que evalúa la robustez de una solución de clustering midiendo su coherencia en ejecuciones repetidas o bajo diferentes condiciones de muestreo.
Cohesión Intra-clúster
Medida de compacidad que evalúa cuán similares o cercanos son los elementos de un mismo clúster entre sí, generalmente calculada como la suma de las distancias intra-clúster.
Separación inter-clúster
Criterio que mide el grado de aislamiento entre diferentes clústeres, cuantificado por la distancia mínima, media o centroide entre los grupos distintos.