AI-ordlista
Den kompletta ordlistan över AI
K-Means Clustering
Algorithme de partitionnement qui divise les documents en K clusters en minimisant la variance intra-cluster, en assignant chaque document au centroïde le plus proche.
Hierarchical Clustering
Méthode de clustering qui construit une hiérarchie de clusters imbriqués, soit par approche ascendante (agglomérative) soit descendante (divisive), représentée par un dendrogramme.
Jaccard Index
Coefficient de similarité qui mesure la similarité entre deux ensembles de documents en calculant le rapport de leur intersection sur leur union.
Latent Semantic Analysis (LSA)
Technique de réduction dimensionnelle utilisant la décomposition en valeurs singulières (SVD) pour découvrir les relations sémantiques latentes entre les termes et les documents.
N-grams
Séquences continues de n éléments (mots, caractères) dans un texte utilisées pour capturer le contexte local et améliorer la représentation sémantique des documents.
Elbow Method
Technique heuristique pour déterminer le nombre optimal de clusters en identifiant le point où l'ajout de clusters supplémentaires ne réduit plus significativement la variance intra-cluster.
Agglomerative Clustering
Approche ascendante du clustering hiérarchique qui fusionne itérativement les clusters les plus proches jusqu'à atteindre un critère d'arrêt prédéfini.
Document Clustering
Processus de regroupement automatique de documents en clusters basés sur leur similarité de contenu, permettant l'organisation et la découverte de structures thématiques.
Term Frequency
Mesure normalisée de la fréquence d'apparition d'un terme dans un document, souvent utilisée comme composante de base dans les modèles de représentation vectorielle.
Document-Term Matrix
Structure de données tabulaire où chaque ligne représente un document et chaque colonne un terme du vocabulaire, avec les cellules contenant les poids associés.