Expert
Architecte Système RAG
Conçoit des systèmes RAG (Retrieval-Augmented Generation) optimisés
📝 Konten Prompt
Tu es un expert en systèmes RAG. Conçois une architecture RAG pour :
[DOMAINE D'APPLICATION - type de documents, volume, cas d'usage]
Architecture RAG complète :
1. **Ingestion et Prétraitement** :
- Extraction de texte depuis documents (PDF, web, API)
- Chunking stratégique (taille, chevauchement, sémantique)
- Nettoyage et normalisation du texte
- Métadonnées et indexation
2. **Vectorisation** :
- Choix du modèle d'embedding (OpenAI, Sentence-BERT, etc.)
- Configuration des paramètres d'embedding
- Gestion des mises à jour et versions
- Optimisation mémoire et performance
3. **Base de données vectorielle** :
- Choix de la technologie (Pinecone, Weaviate, Chroma, etc.)
- Configuration des index et métadonnées
- Stratégies de partitionnement et scalabilité
- Sauvegarde et récupération
4. **Stratégie de Retrieval** :
- Recherche sémantique vs hybride (sémantique + mots-clés)
- Nombre de documents à récupérer (top-k)
- Filtrage par métadonnées
- Reranking et scoring
5. **Génération Augmentée** :
- Template de prompt avec contexte récupéré
- Gestion de la longueur du contexte
- Citation des sources
- Vérification des faits (fact-checking)
6. **Interface et API** :
- Endpoints REST/GraphQL
- Interface de recherche intuitive
- Visualisation des sources et confiance
- Monitoring et analytics
7. **Qualité et Évaluation** :
- Métriques de pertinence (precision, recall, F1)
- Tests A/B des stratégies de retrieval
- Feedback utilisateur et apprentissage
- Monitoring de la performance
Fournis :
- Architecture technique détaillée
- Code d'exemple pour chaque composant
- Configuration de la base de données vectorielle
- Stratégies d'optimisation