Глоссарий ИИ
Полный словарь искусственного интеллекта
Векторная база знаний
Специализированное хранилище, оптимизированное для эмбеддингов, позволяющее выполнять быстрый семантический поиск в больших масштабах с помощью индексов, таких как HNSW или IVF.
HyDE (Hypothetical Document Embeddings)
Продвинутая техника, при которой LLM сначала генерирует идеальный гипотетический документ, а затем использует его эмбеддинг для направления поиска к действительно релевантным документам.
Перекрестное переранжирование
Метод оценки релевантности, при котором модель обрабатывает запрос и документ-кандидат одновременно, в отличие от стандартного подхода с би-энкодером.
Декомпозиция запроса
Стратегия, при которой сложный запрос автоматически разбивается на более простые подзапросы для повышения точности многоаспектного поиска информации.
Синхронный и асинхронный RAG
Различие между синхронным подходом (поиск и генерация в одном вызове) и асинхронным (предварительное индексирование и извлечение в реальном времени) в зависимости от ограничений по задержке.
Формирование промпта (Prompt Shaping)
Искусство оптимизации структуры промпта RAG, включая размещение извлеченных контекстов, инструкции по форматированию и требования к цитированию для максимизации качества ответа.
Многошаговый RAG
Продвинутая архитектура, в которой модель выполняет несколько циклов «извлечение-генерация», используя промежуточные ответы для уточнения и углубления поиска информации.
Динамическая база знаний
Система RAG, в которой база документов непрерывно обновляется в реальном времени, что позволяет получать всегда актуальные ответы без необходимости переобучения модели.
RAG, не зависящий от предметной области
Подход, при котором система извлечения спроектирована для эффективной работы в любой предметной области без специальной адаптации, благодаря использованию эмбеддингов и обобщенных стратегий поиска.
Цитирование источников
Иерархический RAG
Многоуровневая архитектура, в которой извлечение информации сначала выполняется по сводкам или метаданным, а затем по соответствующим подробным документам для оптимизации скорости и релевантности.
Слияние контекстов
Процесс интеллектуальной интеграции нескольких извлеченных документов в единый связный промпт, позволяющий избежать дублирования и максимизировать взаимодополняемость информации.
RAG с памятью
Расширение стандартного RAG, в котором система сохраняет память о предыдущих взаимодействиях для контекстуализации будущих запросов на извлечение и обеспечения диалоговой связности.