Оптимизация контекстного окна
Лимит токенов
Техническое ограничение, определяющее максимальное количество токенов, которые могут быть включены в запрос или ответ модели. Это ограничение напрямую влияет на объем контекстной информации, который может быть использован в системах RAG.
← Назад