Glossaire IA
Le dictionnaire complet de l'Intelligence Artificielle
Apprentissage Actif Multi-annotateurs
Paradigme d'apprentissage automatique où plusieurs annotateurs collaborent pour étiqueter les données les plus informatives sélectionnées par un algorithme actif. Cette approche optimise l'utilisation des ressources humaines en tirant parti des expertises complémentaires et des coûts variables des annotateurs.
Stratégie d'Échantillonnage Collaboratif
Méthode de sélection d'échantillons qui coordonne les préférences et expertises de plusieurs annotateurs pour maximiser la qualité globale des étiquettes. Elle équilibre entre l'incertitude du modèle et la répartition optimale des tâches selon les compétences de chaque annotateur.
Modèle d'Expertise d'Annotateur
Framework probabiliste ou déterministe qui quantifie la compétence, la fiabilité et les biais spécifiques de chaque annotateur sur différentes classes ou types de données. Ce modèle guide l'allocation des échantillons en fonction des forces individuelles de chaque contributeur.
Allocation Dynamique d'Échantillons
Processus adaptatif qui assigne les échantillons non étiquetés aux annotateurs les plus appropriés en temps réel, basé sur leur expertise actuelle et leur disponibilité. Cette allocation optimise le compromis entre qualité d'annotation et budget temporel ou monétaire.
Matrice de Confiance Inter-annotateurs
Structure de données mesurant la cohérence et la fiabilité relatives entre les annotations de différents contributeurs sur des échantillons similaires. Elle permet de détecter les discordances systématiques et d'ajuster les poids de confiance pour l'agrégation finale des labels.
Coût d'Annotation Adaptatif
Modèle de coût variable qui ajuste la rémunération ou le temps alloué à chaque annotation selon la difficulté de l'échantillon et l'expertise requise. Cette approche optimise l'allocation du budget en favorisant les assignments les plus rentables en termes de gain d'information.
Diversité d'Annotations
Critère de sélection qui assure une répartition variée des échantillons entre les annotateurs pour éviter la sur-spécialisation et maximiser la couverture du space d'features. Elle maintient l'équilibre entre l'exploitation des expertises et l'exploration de nouvelles perspectives.
Agrégation de Labels Multi-sources
Technique de fusion qui combine les étiquettes de plusieurs annotateurs en une seule prédiction consensus, utilisant des méthodes comme le vote pondéré, les modèles de Dawid-Skene ou l'inférence bayésienne. Cette agrégation corrige les erreurs individuelles et produit des étiquettes plus fiables.
Sélection par Incertitude Pondérée
Stratégie qui évalue l'incertitude du modèle tout en pondérant cette mesure par le coût et l'expertise nécessaires pour résoudre chaque échantillon. Elle privilégie les instances offrant le meilleur ratio information/bénéfice selon les capacités des annotateurs disponibles.
Requête par Comité Multi-annotateurs
Extension de Query-by-Committee où plusieurs modèles sont entraînés sur différents sous-ensembles d'annotations pour identifier les échantillons avec le plus grand désaccord prédictif. Cette approche est enrichie par la diversité des perspectives des annotateurs dans le comité.
Calibration d'Annotateurs
Processus d'ajustement systématique des prédictions d'annotateurs pour corriger les biais individuels et harmoniser les échelles de confiance entre différents contributeurs. La calibration assure que les scores de fiabilité sont comparables et exploitables pour l'allocation dynamique.
Évaluation d'Qualité d'Annotation
Framework métrique continu qui mesure la précision, la cohérence et la valeur informationnelle des annotations fournies par chaque contributeur. Ces métriques alimentent les modèles d'expertise et guident les décisions d'allocation future.
Routage Intelligent d'Échantillons
Système de décision automatisé qui achemine chaque échantillon non étiqueté vers l'annotateur ou le groupe d'annotateurs optimal basé sur des prédicteurs de performance et des contraintes de ressources. Ce routage maximise l'efficacité du processus d'annotation collaborative.
Apprentissage Semi-supervisé Multi-expert
Approche hybride combinant apprentissage actif multi-annotateurs avec des techniques semi-supervisées pour exploiter les grandes quantités de données non étiquetées. Elle utilise les annotations de haute qualité comme graines pour propager les étiquettes à travers le dataset.
Modèle de Fiabilité d'Annotateur
Représentation mathématique de la probabilité qu'un annotateur produise une annotation correcte, souvent modélisée comme une distribution conditionnelle dépendant du type d'échantillon. Ce modèle évolue dynamiquement avec l'accumulation des annotations historiques.
Stratégie d'Exploration-Exploitation
Cadre décisionnel équilibrant l'assignation d'échantillons familiers aux annotateurs experts (exploitation) avec la découverte des capacités sur de nouveaux types de données (exploration). Cette stratégie évite la sur-spécialisation tout en maximisant la qualité à court terme.
Fusion d'Opinions d'Experts
Méthode sophistiquée d'agrégation qui combine les jugements de plusieurs annotateurs en tenant compte de leur corrélation, leur expertise domain-specific et leur historique de performance. Elle utilise souvent des techniques bayésiennes ou des graphes de croyance pour une fusion optimale.