Context Window Optimization
Token Limit
Contrainte technique spécifiant le nombre maximum de tokens pouvant être inclus dans une requête ou une réponse du modèle. Cette limitation impacte directement la quantité d'information contextuelle pouvant être utilisée dans les systèmes RAG.
← Retour