Глоссарий ИИ
Полный словарь искусственного интеллекта
Структурированная база знаний
Набор данных, организованных в соответствии с предопределенной схемой (например, графы знаний, реляционные базы данных), используемый для хранения и извлечения фактической информации для системы QA.
Извлечение именованных сущностей (NER)
Процесс обработки естественного языка, который идентифицирует и классифицирует ключевую информацию (имена людей, названия организаций, лекарств и т. д.) в неструктурированном тексте для наполнения базы знаний.
Генерация синтетических вопросов
Методика расширения данных, при которой вопросы и ответы на них автоматически создаются на основе существующих документов для обучения моделей QA при наличии небольшого количества реальных данных.
Рассуждение на графе знаний
Способность системы QA выводить новую информацию путем обхода и объединения отношений (ребер) между сущностями (узлами) в графе знаний.
Переписывание запроса
Процесс, который преобразует вопрос пользователя, часто неоднозначный или плохо сформулированный, в оптимизированный запрос для поиска информации или запроса к базе знаний.
Проверка фактов (Fact Checking)
Механизм, проверяющий согласованность и точность сгенерированного ответа путем сопоставления его с надежными источниками в данной области; это критически важно для приложений с высоким уровнем риска, таких как медицина или финансы.
Специализированная языковая модель (Domain-Specific LM)
Языковая модель, предварительно обученная или дообученная на корпусе текстов, специфичных для определенной области (например, медицинские статьи, судебная практика), что позволяет ей понимать и генерировать технический жаргон с большей точностью.
Гибридная система QA
Архитектура, объединяющая несколько подходов (например, извлечение на основе правил, семантический поиск, нейронные модели) для использования их сильных сторон и повышения надежности и точности ответов.
Объяснимость ответов (Answer Explainability)
Способность системы QA предоставлять не только ответ, но и доказательства, источники или рассуждения, которые привели к этому ответу, что существенно для доверия пользователя.
Семантическая индексация
Техника, которая организует документы на основе их смысла и контекста (часто с помощью эмбеддингов), а не ключевых слов, чтобы обеспечить более релевантный поиск.
Конвейер обработки информации
Упорядоченная последовательность этапов (например: прием данных, очистка, NER, индексация), которая преобразует необработанные данные в структурированную и доступную для запросов базу знаний для системы QA.
Дообучение на данных QA
Процесс адаптации предварительно обученной языковой модели с использованием набора данных пар вопрос-ответ, специфичных для определенной предметной области, для улучшения ее производительности в задаче вопрос-ответ.
Определение намерения вопроса
Классификация типа информации, которую ищет пользователь (например: определение, сравнение, список, причина-следствие), для направления стратегии поиска и генерации наиболее подходящего ответа.