Glossaire IA
Le dictionnaire complet de l'Intelligence Artificielle
t-SNE
Algorithme non linéaire de réduction dimensionnelle utilisant des distributions de probabilité pour préserver les structures locales lors de la visualisation de données de haute dimension.
Perplexité
Paramètre crucial du t-SNE contrôlant le nombre effectif de voisins considérés pour chaque point, influençant l'équilibre entre structure locale et globale.
Divergence de Kullback-Leibler
Fonction de coût utilisée dans t-SNE mesurant la dissimilarité entre les distributions de probabilité de l'espace haute et basse dimension.
Matrice de similarité
Structure mathématique représentant les relations probabilistes entre paires de points dans l'espace d'origine, fondée sur les distances gaussiennes.
Kernel gaussien
Fonction noyau exponentielle utilisée pour convertir les distances euclidiennes en probabilités conditionnelles dans l'espace de haute dimension.
t-distribution
Distribution de probabilité à queues lourdes utilisée dans l'espace de faible dimension pour séparer efficacement les points similaires des dissimilaires.
Crowding Problem
Phénomène où les points de dimensions élevées se retrouvent compressés dans l'espace réduit, résolu par t-SNE grâce à la t-distribution.
Barnes-Hut t-SNE
Variante optimisée du t-SNE utilisant une approximation quadruple pour réduire la complexité computationnelle de O(n²) à O(n log n).
Early Exaggeration
Phase initiale du t-SNE amplifiant artificiellement les similarités pour former des clusters bien séparés avant l'affinement final.
Gradient Descent
Algorithme d'optimisation itératif minimisant la divergence KL en ajustant progressivement les positions dans l'espace de faible dimension.
Learning Rate
Paramètre contrôlant la magnitude des mises à jour de positions à chaque itération, crucial pour la convergence et la qualité finale.
Momentum
Technique d'accélération de la convergence ajoutant une fraction du gradient précédent au gradient actuel dans l'optimisation t-SNE.
Structure Locale
Préservation des relations de voisinage immédiat entre points, caractéristique principale du t-SNE contrairement aux structures globales.
Probabilités Conditionnelles
Mesures de similarité symétrisées entre points calculées comme probabilités qu'un point choisisse un autre comme voisin.
Multi-Scale t-SNE
Extension du t-SNE combinant plusieurs perplexités pour capturer simultanément les structures locales et globales des données.
Parametric t-SNE
Variante apprenant une fonction de mapping paramétrique permettant la projection de nouvelles données sans recalcul complet.
Trustworthiness
Métrique d'évaluation quantifiant la préservation des voisins proches dans la projection par rapport à l'espace d'origine.
Neighborhood Graph
Structure de graphe représentant les relations de voisinage utilisée pour initialiser et visualiser les similarités dans t-SNE.