RAG - Retrieval-Augmented Generation

📖

términos

Base de connaissances vectorielle

Stockage spécialisé optimisé pour les embeddings, permettant des recherches de similarité sémantique rapides à grande échelle via des index comme HNSW ou IVF.

📖

términos

HyDE (Hypothetical Document Embeddings)

Technique avancée où le LLM génère d'abord un document hypothétique idéal, puis utilise son embedding pour guider la recherche vers des documents réellement pertinents.

📖

términos

Reranking croisé

Méthode d'évaluation de la pertinence où le modèle traite simultanément la requête et le document candidat, contrairement à l'approche bi-encodeur standard.

📖

términos

Décomposition de requête

Stratégie où une requête complexe est automatiquement décomposée en sous-requêtes plus simples pour améliorer la précision de la récupération d'information multi-facettes.

📖

términos

RAG synchrone vs asynchrone

Distinction entre l'approche synchrone (recherche et génération dans le même appel) et asynchrone (pré-indexation et récupération en temps réel) selon les contraintes de latence.

📖

términos

Façonnage de prompt (Prompt Shaping)

Art d'optimiser la structure du prompt RAG, incluant le placement des contextes récupérés, les instructions de formatage et les contraintes de citation pour maximiser la qualité de réponse.

📖

términos

RAG à plusieurs sauts

Architecture avancée où le modèle effectue plusieurs cycles de récupération-génération, utilisant les réponses intermédiaires pour affiner et approfondir la recherche d'information.

📖

términos

Base de connaissances dynamique

Système RAG où la base de documents est continuellement mise à jour en temps réel, permettant des réponses toujours actuelles sans nécessiter de réentraînement du modèle.

📖

términos

RAG agnóstico al dominio

Enfoque donde el sistema de recuperación está diseñado para funcionar eficazmente en cualquier dominio sin adaptación específica, gracias a embeddings y estrategias de búsqueda generalistas.

📖

términos

Cita de fuentes

📖

términos

RAG jerárquico

Arquitectura multinivel donde la recuperación se realiza primero sobre resúmenes o metadatos, luego sobre los documentos detallados pertinentes para optimizar la velocidad y la pertinencia.

📖

términos

Fusión de contextos

Proceso de integración inteligente de múltiples documentos recuperados en un prompt coherente, evitando redundancias y maximizando la complementariedad de la información.

📖

términos

RAG con memoria

Extensión del RAG estándar donde el sistema mantiene una memoria de las interacciones anteriores para contextualizar las recuperaciones futuras y asegurar una coherencia conversacional.

Glosario IA

Base de connaissances vectorielle

HyDE (Hypothetical Document Embeddings)

Reranking croisé

Décomposition de requête

RAG synchrone vs asynchrone

Façonnage de prompt (Prompt Shaping)

RAG à plusieurs sauts

Base de connaissances dynamique

RAG agnóstico al dominio

Cita de fuentes

RAG jerárquico

Fusión de contextos

RAG con memoria

No se encontraron resultados