Glossaire IA
Le dictionnaire complet de l'Intelligence Artificielle
Cross-Encoder Reranking
Architecture de réordonnancement où le transformateur traite simultanément la requête et chaque document comme une seule séquence d'entrée pour évaluer leur pertinence mutuelle. Cette approche offre une grande précision au détriment d'une complexité computationnelle plus élevée.
MonoT5 Reranking
Modèle de réordonnancement basé sur T5 qui reformule la tâche de classement comme un problème de génération de texte en utilisant des tokens spéciaux 'True' et 'False'. Cette approche permet de réordonner efficacement les documents récupérés en exploitant les capacités de compréhension du langage naturel.
ColBERT Reranking
Système de réordonnancement basé sur une interaction token-level tardive qui encode les documents et requêtes en vecteurs contextualisés pour chaque token. Cette méthode capture des correspondances granulaires tout en maintenant une efficacité computationnelle acceptable.
BGE Reranker
Modèle de réordonnancement optimisé pour les tâches de recherche sémantique, entraîné sur de vastes corpus de données de pertinence avec une architecture cross-encoder. Il excelle dans la discrimination fine entre documents pertinents et non pertinents pour les systèmes RAG.
Listwise Loss
Fonction de perte qui optimise directement l'ordre complet de la liste de documents récupérés plutôt que des paires individuelles. Cette approche considère la distribution de pertinence globale pour améliorer la qualité du réordonnancement.
Pairwise Loss
Fonction d'entraînement qui compare des paires de documents pour apprendre à discriminer entre un document plus pertinent et un moins pertinent. Cette méthode est particulièrement efficace pour les systèmes de réordonnancement en apprentissage supervisé.
Multi-stage Retrieval
Architecture de récupération composée de plusieurs phases successives incluant une récupération initiale large suivie d'un ou plusieurs niveaux de réordonnancement progressivement plus précis. Cette approche équilibre efficacité et précision dans les systèmes RAG à grande échelle.
Passage Reranking
Processus de réordonnancement appliqué spécifiquement aux passages ou segments de texte plutôt qu'aux documents entiers pour une granularité accrue dans la sélection de contenu pertinent. Cette technique optimise la qualité des entrées pour la génération dans RAG.
Learning to Rank (LTR)
Paradigme d'apprentissage automatique appliqué au classement d'informations où des modèles sont entraînés à ordonner des éléments selon leur pertinence. LTR combine des caractéristiques diverses pour optimiser les métriques de classement comme NDCG et MAP.
Neural Information Retrieval
Approche de récupération d'information utilisant des réseaux de neurones pour modéliser la pertinence entre requêtes et documents par des représentations vectorielles denses. Cette méthode capture des relations sémantiques complexes au-delà des simples correspondances de mots-clés.
Dense Retrieval Reranking
Technique de réordonnancement basée sur des embeddings denses qui réévalue la pertinence des documents initialement récupérés en utilisant des similarités vectorielles dans un espace sémantique. Cette méthode affine les résultats de la récupération initiale pour améliorer la qualité finale.
Query-Document Interaction
Mécanisme fondamental dans les systèmes de réordonnancement qui modélise explicitement les interactions entre les termes de la requête et ceux du document pour calculer un score de pertinence. Cette approche capture des dépendances complexes au-delà des représentations indépendantes.
Relevance Feedback Loop
Processus itératif où les jugements de pertinence sur les résultats classés sont utilisés pour raffiner le modèle de réordonnancement ou la requête elle-même. Cette technique d'apprentissage adaptatif améliore continuellement la performance du système.
Attention-based Reranking
Architecture de réordonnancement utilisant des mécanismes d'attention pour identifier et pondérer les parties les plus pertinentes des documents par rapport à la requête. Cette approche permet une évaluation contextuelle fine de la pertinence documentaire.