AI-woordenlijst
Het complete woordenboek van kunstmatige intelligentie
Modèle de mélange gaussien
Approche probabiliste modélisant un ensemble de données comme une combinaison linéaire de plusieurs distributions gaussiennes multivariées, permettant d'identifier des sous-groupes dans les données.
Algorithme EM
Méthode itérative d'estimation de paramètres maximisant la vraisemblance dans les modèles à variables latentes, alternant entre les étapes d'espérance et de maximisation.
Étape E (Expectation)
Phase de l'algorithme EM calculant les probabilités a posteriori d'appartenance de chaque observation aux différents composants du mélange, basée sur les paramètres actuels.
Étape M (Maximization)
Phase de l'algorithme EM mettant à jour les paramètres du modèle (moyennes, covariances, coefficients de mélange) pour maximiser la log-vraisemblance attendue.
Paramètres de mélange
Ensemble des paramètres définissant un GMM incluant les moyennes, matrices de covariance et coefficients de mélange pour chaque composant gaussien.
Coefficients de mélange
Poids associés à chaque composant gaussien du mélange, représentant la probabilité a priori qu'une observation appartienne à ce composant.
Matrice de responsabilité
Matrice contenant les probabilités d'appartenance de chaque observation à chaque cluster, calculée durant l'étape E de l'algorithme EM.
Clustering mou
Approche de clustering où chaque observation peut appartenir à plusieurs clusters avec différents degrés d'appartenance, contrairement au clustering dur.
Critère AIC
Critère d'information d'Akaike évaluant la qualité du modèle en équilibrant l'ajustement aux données et la complexité, utilisé pour sélectionner le nombre optimal de composants.
Critère BIC
Critère d'information bayésien pénalisant plus fortement la complexité du modèle que l'AIC, favorisant des modèles plus parcimonieux.
Initialisation K-means
Technique d'initialisation des paramètres GMM utilisant d'abord l'algorithme K-means pour obtenir des estimations initiales des centres des clusters.
Densité de probabilité
Fonction décrivant la probabilité relative d'observer une valeur continue, modélisée par les composants gaussiens dans un GMM.
Convergence de l'EM
Critère d'arrêt de l'algorithme EM basé sur la variation de la log-vraisemblance entre itérations successives tombant sous un seuil prédéfini.
Ellipse de confiance
Représentation graphique de la région contenant un certain pourcentage de probabilité pour une distribution gaussienne multivariée.
Séparabilité des clusters
Mesure du degré de chevauchement entre les différents composants gaussiens du mélange, influençant la qualité de la segmentation obtenue.