RAG — генерация с дообучением на основе поиска

📖

термины

Векторная база знаний

Специализированное хранилище, оптимизированное для эмбеддингов, позволяющее выполнять быстрый семантический поиск в больших масштабах с помощью индексов, таких как HNSW или IVF.

📖

термины

HyDE (Hypothetical Document Embeddings)

Продвинутая техника, при которой LLM сначала генерирует идеальный гипотетический документ, а затем использует его эмбеддинг для направления поиска к действительно релевантным документам.

📖

термины

Перекрестное переранжирование

Метод оценки релевантности, при котором модель обрабатывает запрос и документ-кандидат одновременно, в отличие от стандартного подхода с би-энкодером.

📖

термины

Декомпозиция запроса

Стратегия, при которой сложный запрос автоматически разбивается на более простые подзапросы для повышения точности многоаспектного поиска информации.

📖

термины

Синхронный и асинхронный RAG

Различие между синхронным подходом (поиск и генерация в одном вызове) и асинхронным (предварительное индексирование и извлечение в реальном времени) в зависимости от ограничений по задержке.

📖

термины

Формирование промпта (Prompt Shaping)

Искусство оптимизации структуры промпта RAG, включая размещение извлеченных контекстов, инструкции по форматированию и требования к цитированию для максимизации качества ответа.

📖

термины

Многошаговый RAG

Продвинутая архитектура, в которой модель выполняет несколько циклов «извлечение-генерация», используя промежуточные ответы для уточнения и углубления поиска информации.

📖

термины

Динамическая база знаний

Система RAG, в которой база документов непрерывно обновляется в реальном времени, что позволяет получать всегда актуальные ответы без необходимости переобучения модели.

📖

термины

RAG, не зависящий от предметной области

Подход, при котором система извлечения спроектирована для эффективной работы в любой предметной области без специальной адаптации, благодаря использованию эмбеддингов и обобщенных стратегий поиска.

📖

термины

Цитирование источников

📖

термины

Иерархический RAG

Многоуровневая архитектура, в которой извлечение информации сначала выполняется по сводкам или метаданным, а затем по соответствующим подробным документам для оптимизации скорости и релевантности.

📖

термины

Слияние контекстов

Процесс интеллектуальной интеграции нескольких извлеченных документов в единый связный промпт, позволяющий избежать дублирования и максимизировать взаимодополняемость информации.

📖

термины

RAG с памятью

Расширение стандартного RAG, в котором система сохраняет память о предыдущих взаимодействиях для контекстуализации будущих запросов на извлечение и обеспечения диалоговой связности.

Глоссарий ИИ

Векторная база знаний

HyDE (Hypothetical Document Embeddings)

Перекрестное переранжирование

Декомпозиция запроса

Синхронный и асинхронный RAG

Формирование промпта (Prompt Shaping)

Многошаговый RAG

Динамическая база знаний

RAG, не зависящий от предметной области

Цитирование источников

Иерархический RAG

Слияние контекстов

RAG с памятью

Результаты не найдены