🏠 Home
Benchmark Hub
📊 All Benchmarks 🦖 Dinosaur v1 🦖 Dinosaur v2 ✅ To-Do List Applications 🎨 Creative Free Pages 🎯 FSACB - Ultimate Showcase 🌍 Translation Benchmark
Models
🏆 Top 10 Models 🆓 Free Models 📋 All Models ⚙️ Kilo Code
Resources
💬 Prompts Library 📖 AI Glossary 🔗 Useful Links

AI Glossary

The complete dictionary of Artificial Intelligence

162
categories
2,032
subcategories
23,060
terms
📖
terms

K-Means Clustering

Algorithme de partitionnement qui divise les documents en K clusters en minimisant la variance intra-cluster, en assignant chaque document au centroïde le plus proche.

📖
terms

Hierarchical Clustering

Méthode de clustering qui construit une hiérarchie de clusters imbriqués, soit par approche ascendante (agglomérative) soit descendante (divisive), représentée par un dendrogramme.

📖
terms

Jaccard Index

Coefficient de similarité qui mesure la similarité entre deux ensembles de documents en calculant le rapport de leur intersection sur leur union.

📖
terms

Latent Semantic Analysis (LSA)

Technique de réduction dimensionnelle utilisant la décomposition en valeurs singulières (SVD) pour découvrir les relations sémantiques latentes entre les termes et les documents.

📖
terms

N-grams

Séquences continues de n éléments (mots, caractères) dans un texte utilisées pour capturer le contexte local et améliorer la représentation sémantique des documents.

📖
terms

Elbow Method

Technique heuristique pour déterminer le nombre optimal de clusters en identifiant le point où l'ajout de clusters supplémentaires ne réduit plus significativement la variance intra-cluster.

📖
terms

Agglomerative Clustering

Approche ascendante du clustering hiérarchique qui fusionne itérativement les clusters les plus proches jusqu'à atteindre un critère d'arrêt prédéfini.

📖
terms

Document Clustering

Processus de regroupement automatique de documents en clusters basés sur leur similarité de contenu, permettant l'organisation et la découverte de structures thématiques.

📖
terms

Term Frequency

Mesure normalisée de la fréquence d'apparition d'un terme dans un document, souvent utilisée comme composante de base dans les modèles de représentation vectorielle.

📖
terms

Document-Term Matrix

Structure de données tabulaire où chaque ligne représente un document et chaque colonne un terme du vocabulaire, avec les cellules contenant les poids associés.

🔍

No results found