Glosario IA
El diccionario completo de la Inteligencia Artificial
Base de connaissances vectorielle
Stockage spécialisé optimisé pour les embeddings, permettant des recherches de similarité sémantique rapides à grande échelle via des index comme HNSW ou IVF.
HyDE (Hypothetical Document Embeddings)
Technique avancée où le LLM génère d'abord un document hypothétique idéal, puis utilise son embedding pour guider la recherche vers des documents réellement pertinents.
Reranking croisé
Méthode d'évaluation de la pertinence où le modèle traite simultanément la requête et le document candidat, contrairement à l'approche bi-encodeur standard.
Décomposition de requête
Stratégie où une requête complexe est automatiquement décomposée en sous-requêtes plus simples pour améliorer la précision de la récupération d'information multi-facettes.
RAG synchrone vs asynchrone
Distinction entre l'approche synchrone (recherche et génération dans le même appel) et asynchrone (pré-indexation et récupération en temps réel) selon les contraintes de latence.
Façonnage de prompt (Prompt Shaping)
Art d'optimiser la structure du prompt RAG, incluant le placement des contextes récupérés, les instructions de formatage et les contraintes de citation pour maximiser la qualité de réponse.
RAG à plusieurs sauts
Architecture avancée où le modèle effectue plusieurs cycles de récupération-génération, utilisant les réponses intermédiaires pour affiner et approfondir la recherche d'information.
Base de connaissances dynamique
Système RAG où la base de documents est continuellement mise à jour en temps réel, permettant des réponses toujours actuelles sans nécessiter de réentraînement du modèle.
RAG agnóstico al dominio
Enfoque donde el sistema de recuperación está diseñado para funcionar eficazmente en cualquier dominio sin adaptación específica, gracias a embeddings y estrategias de búsqueda generalistas.
Cita de fuentes
RAG jerárquico
Arquitectura multinivel donde la recuperación se realiza primero sobre resúmenes o metadatos, luego sobre los documentos detallados pertinentes para optimizar la velocidad y la pertinencia.
Fusión de contextos
Proceso de integración inteligente de múltiples documentos recuperados en un prompt coherente, evitando redundancias y maximizando la complementariedad de la información.
RAG con memoria
Extensión del RAG estándar donde el sistema mantiene una memoria de las interacciones anteriores para contextualizar las recuperaciones futuras y asegurar una coherencia conversacional.