AI 词汇表
人工智能完整词典
Auto-étiquetage
Processus automatique d'assignation d'étiquettes aux données non annotées par un modèle pré-entraîné, basé sur les prédictions de plus haute probabilité pour renforcer l'apprentissage.
Auto-entraînement
Méthode itérative où le modèle s'entraîne sur les données étiquetées, puis utilise ses prédictions les plus fiables pour étiqueter automatiquement de nouvelles données non étiquetées.
Self-training avec confiance
Stratégie de pseudo-étiquetage où seules les prédictions dépassant un seuil de confiance prédéfini sont utilisées pour étiqueter les données non annotées, minimisant l'introduction de bruit.
Pseudo-étiquettes de haute confiance
Étiquettes artificielles générées par le modèle avec une probabilité supérieure à un seuil critique, garantissant une fiabilité accrue avant leur intégration dans l'ensemble d'entraînement.
Étiquetage itératif
Processus cyclique de génération et validation de pseudo-étiquettes à travers plusieurs epochs, où le modèle s'améliore progressivement en utilisant ses propres prédictions raffinées.
Expansion de jeu de données
Augmentation artificielle de la taille du dataset d'entraînement par l'ajout de données non étiquetées précédemment annotées via pseudo-labeling, améliorant la généralisation du modèle.
Apprentissage semi-supervisé transductif
Paradigme où le modèle apprend à prédire spécifiquement sur un ensemble fixe de données non étiquetées, utilisant les pseudo-étiquettes pour optimiser directement sur ces instances cibles.
Pseudo-labeling par consensus
Méthode où plusieurs modèles ou augmentations de données doivent s'accorder sur une prédiction avant de l'accepter comme pseudo-étiquette, augmentant la robustesse du processus d'étiquetage.
Correction d'erreurs par pseudo-étiquettes
Technique avancée utilisant les pseudo-étiquettes pour identifier et corriger potentiellement les erreurs dans les données étiquetées originales, améliorant la qualité globale du dataset.
Pseudo-labeling avec ensemble
Approche combinant les prédictions de plusieurs modèles ensemblistes pour générer des pseudo-étiquettes plus fiables, réduisant le biais individuel et augmentant la stabilité des étiquettes artificielles.
Étiquetage par propagation
Méthode où les étiquettes se propagent à travers le graphe de similarité des données, utilisant les pseudo-étiquettes initiales comme sources pour étendre l'information aux instances voisines non étiquetées.
Pseudo-labeling hiérarchique
Stratégie multi-niveaux générant d'abord des pseudo-étiquettes pour des classes générales puis raffinant progressivement vers des sous-classes plus spécifiques, structurant l'apprentissage hiérarchiquement.
Auto-apprentissage progressif
Approche où le seuil de confiance pour accepter les pseudo-étiquettes diminue progressivement au fur et à mesure que le modèle s'améliore, permettant une expansion graduelle et contrôlée du dataset.
Pseudo-labeling avec validation croisée
Technique utilisant la validation croisée pour évaluer la qualité des pseudo-étiquettes générées, n'intégrant que celles qui améliorent consistently les performances sur les folds de validation.
Étiquetage par similarité
Méthode assignant des pseudo-étiquettes aux données non étiquetées basées sur leur proximité dans l'espace des caractéristiques avec des données étiquetées de haute confiance.
Pseudo-labeling adaptatif
Système dynamique ajustant automatiquement les paramètres de pseudo-étiquetage comme le seuil de confiance et la fréquence d'itération en fonction des performances actuelles du modèle.