Glosario IA
El diccionario completo de la Inteligencia Artificial
Modelo de Mezcla Gaussiana
Enfoque probabilístico que modela un conjunto de datos como una combinación lineal de varias distribuciones gaussianas multivariadas, permitiendo identificar subgrupos en los datos.
Algoritmo EM
Método iterativo de estimación de parámetros que maximiza la verosimilitud en modelos con variables latentes, alternando entre los pasos de expectativa y maximización.
Paso E (Expectativa)
Fase del algoritmo EM que calcula las probabilidades a posteriori de pertenencia de cada observación a los diferentes componentes de la mezcla, basándose en los parámetros actuales.
Paso M (Maximización)
Fase del algoritmo EM que actualiza los parámetros del modelo (medias, covarianzas, coeficientes de mezcla) para maximizar la log-verosimilitud esperada.
Parámetros de mezcla
Conjunto de parámetros que definen un GMM, incluyendo las medias, matrices de covarianza y coeficientes de mezcla para cada componente gaussiano.
Coeficientes de mezcla
Pesos asociados a cada componente gaussiano de la mezcla, que representan la probabilidad a priori de que una observación pertenezca a ese componente.
Matriz de responsabilidad
Matriz que contiene las probabilidades de pertenencia de cada observación a cada clúster, calculada durante el paso E del algoritmo EM.
Clustering suave
Enfoque de clustering donde cada observación puede pertenecer a varios clústeres con diferentes grados de pertenencia, a diferencia del clustering duro.
Criterio AIC
Criterio de información de Akaike que evalúa la calidad del modelo equilibrando el ajuste a los datos y la complejidad, utilizado para seleccionar el número óptimo de componentes.
Criterio BIC
Criterio de información bayesiano que penaliza la complejidad del modelo más fuertemente que el AIC, favoreciendo modelos más parsimoniosos.
Inicialización K-means
Técnica de inicialización de los parámetros GMM utilizando primero el algoritmo K-means para obtener estimaciones iniciales de los centros de los clústeres.
Densidad de probabilidad
Función que describe la probabilidad relativa de observar un valor continuo, modelada por los componentes gaussianos en un GMM.
Convergencia del EM
Criterio de parada del algoritmo EM basado en la variación de la log-verosimilitud entre iteraciones sucesivas cayendo por debajo de un umbral predefinido.
Elipse de confianza
Representación gráfica de la región que contiene un cierto porcentaje de probabilidad para una distribución gaussiana multivariada.
Separabilidad de los clústeres
Medida del grado de solapamiento entre los diferentes componentes gaussianos de la mezcla, influyendo en la calidad de la segmentación obtenida.