Глоссарий ИИ
Полный словарь искусственного интеллекта
Обрезка CART
Процесс уменьшения сложности дерева путём удаления наименее значимых ветвей для предотвращения переобучения при минимизации ошибки валидации.
Бинарное разделение
Специфический для CART метод, при котором каждый родительский узел делится ровно на два дочерних узла с использованием оптимального критерия разделения.
Параметр сложности
Коэффициент альфа в обрезке CART, который штрафует размер дерева, балансируя точность и простоту модели.
Максимальное дерево
Полностью развитое дерево решений без обрезки, где каждый лист содержит наблюдения одного класса или достигает предопределённого критерия остановки.
Минимальная нечистота
Предопределённый порог в CART, который останавливает разделение узла, когда нечистота (Gini или дисперсия) ниже этого значения.
Последовательность обрезки
Упорядоченный набор деревьев убывающей сложности, генерируемых CART, где каждое является обрезанной версией предыдущего.
Ошибка ресубституции
Коэффициент ошибки, вычисленный на обучающих данных, используемый CART как эталон для оценки влияния каждого потенциального обрезания.
Оптимизация CART
Жадный алгоритм, который выполняет локально оптимальные разделения в каждом узле, не гарантируя глобальную оптимальность финального дерева.
Стабильность CART
Чувствительность алгоритма CART к изменениям в обучающих данных, что может приводить к значительно различающимся структурам деревьев.
Обработка отсутствующих значений
Специфический подход CART, который перенаправляет наблюдения с отсутствующими значениями в наиболее подходящий дочерний узел на основе условных вероятностей.
Взвешивание классов
Техника в CART для управления дисбалансом классов путем корректировки весов при расчете индекса Джини.
V-кратная перекрестная проверка
Метод, используемый с CART для оценки производительности различных последовательностей обрезки и выбора оптимального дерева.
Правило принятия решений CART
Набор логических условий if-then, извлеченных из пути от корня к листу, интерпретируемый и непосредственно применимый для прогнозирования.