Глоссарий ИИ
Полный словарь искусственного интеллекта
Синтаксический анализ
Алгоритмический процесс грамматического разбора, который декомпозирует предложение на его структурные составляющие для извлечения формального синтаксиса. Эта операция выявляет иерархические отношения между словами и группами слов в соответствии с правилами грамматики.
Синтаксическое дерево
Древовидное представление грамматической структуры предложения, где узлы соответствуют синтаксическим составляющим, а ветви — отношениям зависимости. Эта иерархическая структура визуализирует организацию слов в синтагмы и предложения согласно грамматическим правилам.
Зависимостный анализ
Подход к синтаксическому анализу, который моделирует грамматические отношения как прямые зависимости между словами, без концепции промежуточных составляющих. Этот метод выявляет отношения «голова-зависимый» для представления синтаксической структуры плоским образом.
Анализ составляющих
Метод синтаксического анализа, который декомпозирует предложение на иерархические составляющие, такие как именные, глагольные и предложные синтагмы. Этот подход, основанный на грамматиках составляющих, выявляет вложенные отношения между группами слов.
Морфосинтаксическая разметка
Процесс автоматической присвоения грамматических тегов каждому слову в тексте, таких как существительное, глагол, прилагательное или детерминатив. Эта морфосинтаксическая аннотация является важным предварительным этапом для полного синтаксического анализа.
Именная синтагма
Синтаксическая составляющая, центрированная вокруг основного существительного и потенциально включающая детерминативы, прилагательные или дополнения существительного. Эта грамматическая единица формирует согласованную группу, функционирующую как один элемент в структуре предложения.
Отношение «голова-зависимый»
Фундаментальная синтаксическая связь в зависимостном анализе, где слово, называемое головой, управляет одним или несколькими зависимыми в структуре предложения. Эти направленные отношения отражают основные грамматические связи между элементами речи.
Синтаксический анализатор
Компьютерная программа, реализующая алгоритмы для выполнения грамматического разбора предложений в соответствии с формальными лингвистическими моделями. Эти парсеры могут использовать подходы на основе правил, статистические или нейронные для построения синтаксических структур.
Контекстно-свободная грамматика
Грамматический формализм, в котором правила продукции применяются независимо от контекста нетерминальных символов, широко используемый в синтаксическом анализе. Эта модель Типа 2 в иерархии Хомского позволяет эффективно описывать структуры многих естественных языков.
Фразовый составляющий
Синтаксическая единица, образующая связный сегмент предложения, обладающий определённой грамматической функцией, такой как подлежащее, дополнение или атрибут. Эти составляющие могут быть простыми или сложными и вкладываться друг в друга для формирования полной иерархической структуры.
Глубина дерева
Метрическая мера, указывающая на максимальное количество иерархических уровней в синтаксическом дереве, отражающая структурную сложность предложения. Эта характеристика часто влияет на сложность анализа и производительность алгоритмов парсинга.
Поверхностный анализ
Уровень синтаксического анализа, концентрирующийся на наблюдаемой грамматической структуре без интерпретации глубокого семантического смысла высказываний. Этот подход рассматривает синтаксическую форму как формальную систему, независимую от семантической интерпретации.
Синтаксическая проекция
Механизм, посредством которого лексические свойства синтаксической вершины определяют структуру и характеристики её прямых зависимых. Этот фундаментальный принцип объясняет, как грамматические категории иерархически организуют предложения.
Структурная неоднозначность
Феномен, при котором одна и та же последовательность слов может получить несколько различных синтаксических анализов, создавая альтернативные древовидные структуры. Эта неоднозначность представляет собой серьезную проблему для систем автоматического парсинга и требует стратегий разрешения неоднозначности.
Граница составляющего
Позиция в предложении, где заканчивается один синтаксический составляющий и начинается другой, отмечающая пределы грамматических единиц. Точная идентификация этих границ имеет решающее значение для корректного синтаксического анализа.
Постэггинг
Сокращение от Part-of-Speech tagging, обозначающее процесс автоматической разметки слов их соответствующими грамматическими категориями. Эта предварительная стадия предоставляет важную информацию для более сложных синтаксических анализов.
Иерархическая структура
Организация синтаксических составляющих в виде вложенных уровней, отражающая отношения доминирования и подчинения в предложении. Эта древовидная структура представляет, как грамматические элементы объединяются для формирования всё более сложных единиц.