Otimização da Janela de Contexto
Limite de Tokens
Restrição técnica que especifica o número máximo de tokens que podem ser incluídos em uma solicitação ou resposta do modelo. Esta limitação impacta diretamente a quantidade de informação contextual que pode ser usada em sistemas RAG.
← Voltar