Glossaire IA
Le dictionnaire complet de l'Intelligence Artificielle
UMAP
Uniform Manifold Approximation and Projection, algorithme de réduction dimensionnelle non linéaire préservant à la fois les structures locales et globales des données dans un espace de faible dimension.
Variété différentielle
Espace topologique ressemblant localement à l'espace euclidien, fondé sur la théorie des variétés pour modéliser la structure intrinsèque des données en haute dimension.
Fuzzy simplicial set
Structure mathématique généralisant les ensembles simpliciaux en attribuant des poids aux relations entre points, permettant une représentation floue des relations de voisinage dans UMAP.
Spectral embedding
Technique d'intégration basée sur la décomposition en valeurs propres de matrices de similarité, utilisée dans UMAP pour initialiser l'optimisation de la projection.
Force-directed layout
Algorithme de visualisation simulant des forces physiques entre points pour optimiser leur positionnement, appliqué dans UMAP pour minimiser la divergence entre espaces.
Optimisation stochastique
Méthode d'optimisation utilisant des échantillons aléatoires pour minimiser une fonction de coût, employée par UMAP pour ajuster les coordonnées de faible dimension.
Structure locale
Relations de proximité immédiate entre points de données dans l'espace original, préservées par UMAP pour maintenir les groupements naturels des données.
Structure globale
Relations à grande échelle entre clusters et régions de données, maintenues par UMAP pour conserver la topologie générale de l'ensemble de données.
Distance géodésique
Mesure de distance suivant la courbure de la variété des données, utilisée par UMAP pour calculer les vraies distances entre points dans l'espace intrinsèque.
Voisinage k-plus proche
Ensemble des k points les plus proches d'un point donné selon une métrique définie, fondamental pour construire le graphe de voisinage dans UMAP.
Entropie croisée
Fonction de perte mesurant la divergence entre distributions de probabilité, optimisée par UMAP pour aligner les espaces haute et faible dimension.
Apprentissage de variété
Paradigme d'apprentissage automatique découvrant la structure de variété sous-jacente des données, dont UMAP est une implémentation moderne.
Graphe de voisinage
Structure de données représentant les relations de proximité entre points, construite par UMAP pour modéliser la topologie locale des données.
Coordonnées barycentriques
Représentation d'un point comme combinaison pondérée de points de référence, utilisée par UMAP pour l'initialisation et l'interpolation des projections.
Métrique personnalisée
Fonction de distance définie par l'utilisateur pour mesurer la similarité entre points, supportée par UMAP pour adapter l'algorithme à des domaines spécifiques.
Densité adaptative
Capacité d'UMAP à ajuster dynamiquement la résolution locale en fonction de la densité des données, préservant les structures dans les régions denses et clairsemées.
Minima locaux
Points d'équilibre suboptimaux dans le paysage d'optimisation, évités par UMAP grâce à des techniques d'initialisation et d'optimisation avancées.
Transformée de Laplace
Opérateur mathématique appliqué sur le graphe de voisinage dans UMAP pour capturer les propriétés géométriques et topologiques des données.
Hyperparamètre n_neighbors
Paramètre contrôlant la taille du voisinage local dans UMAP, influençant l'équilibre entre préservation des structures locales et globales.
Hyperparamètre min_dist
Paramètre régularisant la compacité des clusters dans UMAP, contrôlant la distance minimale entre points dans l'espace projeté.