Glossario IA
Il dizionario completo dell'Intelligenza Artificiale
Ensemble simplicial flou
Structure mathématique utilisée par UMAP pour représenter les relations de voisinage entre points de données, permettant une modélisation souple des connexions locales dans l'espace de grande dimension.
Apprentissage de variétés
Paradigme d'apprentissage non supervisé qui suppose que les données de grande dimension résident sur une variété de plus faible dimension, cherchant à découvrir cette structure sous-jacente.
Connectivité locale
Capacité d'une méthode de réduction dimensionnelle à maintenir les relations de voisinage immédiat entre points proches dans l'espace d'origine après projection en basse dimension.
Optimisation par entropie croisée
Processus d'optimisation utilisé par UMAP pour minimiser la divergence entre les probabilités de voisinage dans l'espace de haute et basse dimensions, préservant ainsi la structure topologique.
Nombre de voisins (n_neighbors)
Paramètre clé d'UMAP contrôlant l'équilibre entre préservation de structure locale et globale, déterminant la taille du voisinage local considéré pour chaque point de données.
Distance minimale (min_dist)
Paramètre UMAP régulant le degré de compacité des points dans l'espace de projection, contrôlant la distance minimale effective entre points voisins dans l'embedding final.
Métrique de distance
Fonction mathématique utilisée par UMAP pour mesurer les similarités entre points dans l'espace de haute dimension, influençant directement la structure topologique découverte.
Preservation de structure globale
Capacité d'UMAP à maintenir les relations à grande échelle entre clusters de données éloignés, évitant l'effet de 'crowding problem' typique des techniques t-SNE.
Descente de gradient stochastique
Algorithme d'optimisation utilisé par UMAP pour ajuster itérativement les positions des points dans l'espace de faible dimension en minimisant la fonction de perte.
Analyse topologique des données
Branche des mathématiques appliquées sur laquelle s'appuie UMAP, étudiant les propriétés invariantes sous déformation continue pour comprendre la structure des données.
Fonction de perte UMAP
Fonction objectif spécifique à UMAP combinant forces attractives pour les voisins et forces répulsives pour les points non-voisins, optimisée via cross-entropy floue.
Dimensionnalité intrinsèque
Nombre minimal de dimensions nécessaires pour représenter fidèlement la structure essentielle des données, concept clé que UMAP cherche à estimer et préserver.
Spectre de valeurs propres
Ensemble des valeurs propres de la matrice laplacienne du graphe de voisinage, utilisé par UMAP pour déterminer la structure géométrique optimale de la projection.
Force attractive-répulsive
Mécanisme physique simulé par UMAP où les points voisins s'attirent tandis que les points non-voisins se repoussent, créant une disposition spatiale équilibrée.
Transformée de UMAP
Fonction de mapping apprise par UMAP permettant de projeter de nouveaux points dans l'espace déjà calculé sans nécessiter un recalcul complet de l'embedding.