قاموس الذكاء الاصطناعي
القاموس الكامل للذكاء الاصطناعي
Dense Passage Retrieval (DPR)
Architecture de récupération dense spécifiquement conçue pour extraire des passages pertinents, utilisant des encodeurs BERT séparés pour les questions et les passages avec un apprentissage contrastif.
Bi-Encoder Architecture
Architecture de récupération utilisant deux encodeurs indépendants pour les requêtes et documents, permettant une indexation pré-calculée des documents pour une recherche à grande échelle.
Cross-Encoder Architecture
Architecture où la requête et le document sont concaténés et traités ensemble par un même encodeur, offrant une précision supérieure au détriment de la vitesse de recherche.
Hierarchical Navigable Small World (HNSW)
Algorithme d'indexation de vecteurs utilisant des graphes multi-niveaux pour une recherche approximative des plus proches voisins avec un excellent compromis entre vitesse et précision.
Maximal Marginal Relevance (MMR)
Algorithme de diversification des résultats de recherche équilibrant pertinence et nouveauté, sélectionnant des documents qui maximisent la pertinence tout en minimisant la redondance sémantique.
Hybrid Search
Approche combinant récupération dense et sparse pour tirer profit des forces respectives de la recherche sémantique et de la recherche par mots-clés, améliorant la précision globale.
Sentence Transformers
Modèles BERT spécifiquement entraînés pour générer des embeddings de phrases de haute qualité, optimisés pour les tâches de similarité sémantique et de clustering.
Vector Indexing
Processus d'organisation des vecteurs denses dans des structures de données spécialisées pour accélérer les requêtes de similarité, essentiel pour la recherche à grande échelle.
Dense Retrieval Augmented Generation
Extension du RAG utilisant spécifiquement la récupération dense pour fournir un contexte pertinent aux modèles de génération, améliorant la cohérence et l'exactitude factuelle des réponses générées.
Late Interaction
Paradigme de récupération où les interactions entre requête et document se produisent tard dans le processus, après encodage séparé, permettant un compromis entre précision et efficacité computationnelle.