Glossaire IA
Le dictionnaire complet de l'Intelligence Artificielle
Densité Pondérée
Méthode de sélection combinant la mesure d'incertitude du modèle avec une estimation de densité locale pour privilégier les échantillons à la fois incertains et situés dans des régions denses de l'espace de caractéristiques.
Requête par Incertitude
Stratégie d'apprentissage actif qui sélectionne les échantillons pour lesquels le modèle présente le plus faible niveau de confiance dans ses prédictions, mesuré généralement par l'entropie ou la marge de décision.
Requête par Comité
Approche d'apprentissage actif utilisant plusieurs modèles formant un comité, où les échantillons provoquant le plus de désaccord entre les membres du comité sont sélectionnés pour annotation.
Échantillonnage Basé sur la Diversité
Stratégie de sélection cherchant à maximiser la diversité des échantillons annotés pour couvrir efficacement l'espace de caractéristiques et éviter la redondance informationnelle.
Points de Densité Élevée
Échantillons situés dans des régions de l'espace de caractéristiques présentant une forte concentration de données, considérés comme représentatifs de la distribution sous-jacente des données.
Critère d'Information Mutuelle
Métrique d'utilité informationnelle mesurant la réduction d'incertitude attendue sur les paramètres du modèle après l'annotation d'un échantillon spécifique.
Marge de Confiance
Différence entre les probabilités prédites des deux classes les plus probables pour un échantillon, utilisée comme indicateur d'incertitude dans les stratégies d'apprentissage actif.
Sélection Hybride
Approche combinant plusieurs critères de sélection (incertitude, densité, diversité) par pondération ou optimisation multi-objectifs pour identifier les échantillons les plus informatifs.
Outliers en Apprentissage Actif
Points de données atypiques ou aberrants que les stratégies basées sur la densité cherchent à éviter, car leur annotation apporte peu d'information sur la structure générale des données.
Pondération par Noyau
Technique utilisant des fonctions noyau pour estimer la densité locale et pondérer l'importance des échantillons selon leur similarité avec leurs voisins dans l'espace de caractéristiques.
Représentativité des Données
Qualité d'un échantillon ou d'un sous-ensemble à capturer les caractéristiques essentielles de la distribution globale des données, facteur clé dans les stratégies d'échantillonnage efficaces.
Espaces de Caractéristiques
Domaine multidimensionnel où chaque dimension représente une caractéristique des données, utilisé pour analyser les relations de similarité et de densité entre les échantillons.
Critère de Densité-Incertitude
Fonction d'utilité combinant une mesure d'incertitude du modèle avec une estimation de densité locale pour évaluer le potentiel informationnel de chaque échantillon non annoté.
Optimisation Multi-Objectifs
Cadre mathématique permettant de gérer simultanément plusieurs objectifs conflictuels comme l'incertitude, la densité et la diversité dans les stratégies de sélection actives.