Глоссарий ИИ
Полный словарь искусственного интеллекта
Дерево Решений
Контролируемая предиктивная модель, которая использует древовидную структуру для моделирования решений и их возможных последствий через серию тестов по признакам данных.
Корневой Узел
Начальная точка дерева решений, представляющая полный набор обучающих данных и содержащая первое разделение на основе наиболее дискриминирующего признака.
Внутренний Узел
Промежуточный узел в дереве решений, который представляет тест по конкретному признаку и разделяет данные на однородные подмножества.
Лист
Конечный узел дерева решений, представляющий окончательное решение или предсказание класса, без возможности дальнейшего разделения.
Критерий Разделения
Количественный метод, используемый для оценки качества разделения в дереве решений, направленный на максимизацию однородности результирующих подмножеств.
Энтропия
Математическая мера беспорядка или неопределенности в наборе данных, используемая для количественной оценки нечистоты узла в деревьях решений.
Информационный Выигрыш
Метрика, измеряющая уменьшение энтропии при разделении узла по определенному признаку, используемая для выбора наилучшего разделения.
Индекс Джини
Мера нечистоты, варьирующаяся от 0 до 1, вычисляющая вероятность того, что случайно выбранный элемент будет неверно классифицирован, является альтернативой энтропии в деревьях решений.
Обрезка
Техника снижения сложности дерева решений путем удаления ветвей, которые вносят малый предсказательный потенциал, чтобы избежать переобучения.
Переобучение
Явление, при котором модель чрезмерно изучает детали и шум обучающих данных в ущерб ее способности к обобщению на новых данных.
Глубина дерева
Максимальное количество разделений от корневого узла до листа, критически важный параметр, контролирующий сложность и смещение модели.
CART
Алгоритм классификационных и регрессионных деревьев, который строит бинарные деревья, используя индекс Джини в качестве критерия разделения для классификации.
ID3
Пионерский алгоритм деревьев решений, использующий прирост информации в качестве критерия разделения, ограниченный категориальными переменными и бинарными разделениями.
C4.5
Улучшение алгоритма ID3, которое использует соотношение прироста информации для избежания смещения в сторону характеристик со множеством значений.
Целевая переменная
Переменная, которую нужно предсказать в задаче обучения с учителем, представленная конечными листами дерева решений.
Правило решения
Логический набор условий IF-THEN, извлеченный из пути в дереве решений, позволяющий интерпретировать и объяснять прогнозы модели.
Важность переменных
Количественная мера вклада каждой предиктивной характеристики в улучшение чистоты разделений на протяжении всего дерева.
Стоимость сложности
Параметр обрезки, который штрафует размер дерева, сбалансировав подгонку данных и простоту модели для оптимизации обобщения.