🏠 Home
Benchmark Hub
📊 All Benchmarks 🦖 Dinosaur v1 🦖 Dinosaur v2 ✅ To-Do List Applications 🎨 Creative Free Pages 🎯 FSACB - Ultimate Showcase 🌍 Translation Benchmark
Models
🏆 Top 10 Models 🆓 Free Models 📋 All Models ⚙️ Kilo Code
Resources
💬 Prompts Library 📖 AI Glossary 🔗 Useful Links

AI Glossary

The complete dictionary of Artificial Intelligence

162
categories
2,032
subcategories
23,060
terms
📂
subcategories

Validation Croisée

Technique d'évaluation partitionnant les données en sous-ensembles pour tester la généralisation du modèle sur plusieurs itérations.

2 terms
📂
subcategories

Tests Statistiques

Méthodes statistiques formelles pour comparer significativement les performances entre différents modèles ou configurations.

15 terms
📂
subcategories

Métriques de Performance

Ensemble d'indicateurs quantitatifs (précision, rappel, F1-score, MAE, RMSE) mesurant la qualité des prédictions selon le contexte.

9 terms
📂
subcategories

Analyse Biais-Variance

Décomposition de l'erreur de généralisation en biais (sous-apprentissage) et variance (surapprentissage) pour optimiser la complexité du modèle.

13 terms
📂
subcategories

Tests de Robustesse

Évaluation de la stabilité des prédictions face aux perturbations, bruit et variations dans les données d'entrée.

13 terms
📂
subcategories

Validation Temporelle

Méthodologie spécifique aux données séquentielles où l'entraînement utilise des périodes antérieures au test pour simuler des conditions réelles.

10 terms
📂
subcategories

Courbes ROC et AUC

Outils graphiques et métriques pour évaluer les performances des classificateurs binaires à différents seuils de décision.

3 terms
📂
subcategories

Calibration de Modèles

Ajustement des probabilités prédites pour qu'elles reflètent fidèlement les vraies fréquences d'occurrence des événements.

6 terms
📂
subcategories

Tests d'Équité

Évaluation des biais démographiques et discrimination potentielle du modèle selon des critères éthiques et réglementaires.

10 terms
📂
subcategories

Analyse d'Erreurs

Examen systématique des prédictions incorrectes pour identifier les schémas d'échec et guider l'amélioration du modèle.

9 terms
📂
subcategories

Validation par Bootstrap

Technique de rééchantillonnage avec remplacement pour estimer la variabilité et la fiabilité des métriques de performance.

9 terms
📂
subcategories

Tests de Stress

Évaluation du comportement du modèle dans des conditions extrêmes ou edge cases pour identifier ses limites opérationnelles.

16 terms
📂
subcategories

Tests de Sensibilité

Analyse de l'impact des variations des caractéristiques d'entrée sur les prédictions pour comprendre la stabilité du modèle.

13 terms
📂
subcategories

Validation Externe

Test du modèle sur des données provenant de sources ou distributions complètement nouvelles pour évaluer sa capacité de généralisation.

9 terms
📂
subcategories

Tests de Dégradation

Suivi continu de la performance du modèle en production pour détecter les drifts de données et la dégradation temporelle.

7 terms
🔍

No results found