Apprentissage Actif Multi-annotateurs

📖

termes

Apprentissage Actif Multi-annotateurs

Paradigme d'apprentissage automatique où plusieurs annotateurs collaborent pour étiqueter les données les plus informatives sélectionnées par un algorithme actif. Cette approche optimise l'utilisation des ressources humaines en tirant parti des expertises complémentaires et des coûts variables des annotateurs.

📖

termes

Stratégie d'Échantillonnage Collaboratif

Méthode de sélection d'échantillons qui coordonne les préférences et expertises de plusieurs annotateurs pour maximiser la qualité globale des étiquettes. Elle équilibre entre l'incertitude du modèle et la répartition optimale des tâches selon les compétences de chaque annotateur.

📖

termes

Modèle d'Expertise d'Annotateur

Framework probabiliste ou déterministe qui quantifie la compétence, la fiabilité et les biais spécifiques de chaque annotateur sur différentes classes ou types de données. Ce modèle guide l'allocation des échantillons en fonction des forces individuelles de chaque contributeur.

📖

termes

Allocation Dynamique d'Échantillons

Processus adaptatif qui assigne les échantillons non étiquetés aux annotateurs les plus appropriés en temps réel, basé sur leur expertise actuelle et leur disponibilité. Cette allocation optimise le compromis entre qualité d'annotation et budget temporel ou monétaire.

📖

termes

Matrice de Confiance Inter-annotateurs

Structure de données mesurant la cohérence et la fiabilité relatives entre les annotations de différents contributeurs sur des échantillons similaires. Elle permet de détecter les discordances systématiques et d'ajuster les poids de confiance pour l'agrégation finale des labels.

📖

termes

Coût d'Annotation Adaptatif

Modèle de coût variable qui ajuste la rémunération ou le temps alloué à chaque annotation selon la difficulté de l'échantillon et l'expertise requise. Cette approche optimise l'allocation du budget en favorisant les assignments les plus rentables en termes de gain d'information.

📖

termes

Diversité d'Annotations

Critère de sélection qui assure une répartition variée des échantillons entre les annotateurs pour éviter la sur-spécialisation et maximiser la couverture du space d'features. Elle maintient l'équilibre entre l'exploitation des expertises et l'exploration de nouvelles perspectives.

📖

termes

Agrégation de Labels Multi-sources

Technique de fusion qui combine les étiquettes de plusieurs annotateurs en une seule prédiction consensus, utilisant des méthodes comme le vote pondéré, les modèles de Dawid-Skene ou l'inférence bayésienne. Cette agrégation corrige les erreurs individuelles et produit des étiquettes plus fiables.

📖

termes

Sélection par Incertitude Pondérée

Stratégie qui évalue l'incertitude du modèle tout en pondérant cette mesure par le coût et l'expertise nécessaires pour résoudre chaque échantillon. Elle privilégie les instances offrant le meilleur ratio information/bénéfice selon les capacités des annotateurs disponibles.

📖

termes

Requête par Comité Multi-annotateurs

Extension de Query-by-Committee où plusieurs modèles sont entraînés sur différents sous-ensembles d'annotations pour identifier les échantillons avec le plus grand désaccord prédictif. Cette approche est enrichie par la diversité des perspectives des annotateurs dans le comité.

📖

termes

Calibration d'Annotateurs

Processus d'ajustement systématique des prédictions d'annotateurs pour corriger les biais individuels et harmoniser les échelles de confiance entre différents contributeurs. La calibration assure que les scores de fiabilité sont comparables et exploitables pour l'allocation dynamique.

📖

termes

Évaluation d'Qualité d'Annotation

Framework métrique continu qui mesure la précision, la cohérence et la valeur informationnelle des annotations fournies par chaque contributeur. Ces métriques alimentent les modèles d'expertise et guident les décisions d'allocation future.

📖

termes

Routage Intelligent d'Échantillons

Système de décision automatisé qui achemine chaque échantillon non étiqueté vers l'annotateur ou le groupe d'annotateurs optimal basé sur des prédicteurs de performance et des contraintes de ressources. Ce routage maximise l'efficacité du processus d'annotation collaborative.

📖

termes

Apprentissage Semi-supervisé Multi-expert

Approche hybride combinant apprentissage actif multi-annotateurs avec des techniques semi-supervisées pour exploiter les grandes quantités de données non étiquetées. Elle utilise les annotations de haute qualité comme graines pour propager les étiquettes à travers le dataset.

📖

termes

Modèle de Fiabilité d'Annotateur

Représentation mathématique de la probabilité qu'un annotateur produise une annotation correcte, souvent modélisée comme une distribution conditionnelle dépendant du type d'échantillon. Ce modèle évolue dynamiquement avec l'accumulation des annotations historiques.

📖

termes

Stratégie d'Exploration-Exploitation

Cadre décisionnel équilibrant l'assignation d'échantillons familiers aux annotateurs experts (exploitation) avec la découverte des capacités sur de nouveaux types de données (exploration). Cette stratégie évite la sur-spécialisation tout en maximisant la qualité à court terme.

📖

termes

Fusion d'Opinions d'Experts

Méthode sophistiquée d'agrégation qui combine les jugements de plusieurs annotateurs en tenant compte de leur corrélation, leur expertise domain-specific et leur historique de performance. Elle utilise souvent des techniques bayésiennes ou des graphes de croyance pour une fusion optimale.

Glossaire IA