Densité Pondérée

📖

termes

Méthode de sélection combinant la mesure d'incertitude du modèle avec une estimation de densité locale pour privilégier les échantillons à la fois incertains et situés dans des régions denses de l'espace de caractéristiques.

📖

termes

Requête par Incertitude

Stratégie d'apprentissage actif qui sélectionne les échantillons pour lesquels le modèle présente le plus faible niveau de confiance dans ses prédictions, mesuré généralement par l'entropie ou la marge de décision.

📖

termes

Requête par Comité

Approche d'apprentissage actif utilisant plusieurs modèles formant un comité, où les échantillons provoquant le plus de désaccord entre les membres du comité sont sélectionnés pour annotation.

📖

termes

Échantillonnage Basé sur la Diversité

Stratégie de sélection cherchant à maximiser la diversité des échantillons annotés pour couvrir efficacement l'espace de caractéristiques et éviter la redondance informationnelle.

📖

termes

Points de Densité Élevée

Échantillons situés dans des régions de l'espace de caractéristiques présentant une forte concentration de données, considérés comme représentatifs de la distribution sous-jacente des données.

📖

termes

Critère d'Information Mutuelle

Métrique d'utilité informationnelle mesurant la réduction d'incertitude attendue sur les paramètres du modèle après l'annotation d'un échantillon spécifique.

📖

termes

Marge de Confiance

Différence entre les probabilités prédites des deux classes les plus probables pour un échantillon, utilisée comme indicateur d'incertitude dans les stratégies d'apprentissage actif.

📖

termes

Sélection Hybride

Approche combinant plusieurs critères de sélection (incertitude, densité, diversité) par pondération ou optimisation multi-objectifs pour identifier les échantillons les plus informatifs.

📖

termes

Outliers en Apprentissage Actif

Points de données atypiques ou aberrants que les stratégies basées sur la densité cherchent à éviter, car leur annotation apporte peu d'information sur la structure générale des données.

📖

termes

Pondération par Noyau

Technique utilisant des fonctions noyau pour estimer la densité locale et pondérer l'importance des échantillons selon leur similarité avec leurs voisins dans l'espace de caractéristiques.

📖

termes

Représentativité des Données

Qualité d'un échantillon ou d'un sous-ensemble à capturer les caractéristiques essentielles de la distribution globale des données, facteur clé dans les stratégies d'échantillonnage efficaces.

📖

termes

Espaces de Caractéristiques

Domaine multidimensionnel où chaque dimension représente une caractéristique des données, utilisé pour analyser les relations de similarité et de densité entre les échantillons.

📖

termes

Critère de Densité-Incertitude

Fonction d'utilité combinant une mesure d'incertitude du modèle avec une estimation de densité locale pour évaluer le potentiel informationnel de chaque échantillon non annoté.

📖

termes

Optimisation Multi-Objectifs

Cadre mathématique permettant de gérer simultanément plusieurs objectifs conflictuels comme l'incertitude, la densité et la diversité dans les stratégies de sélection actives.

Glossaire IA