Глоссарий ИИ
Полный словарь искусственного интеллекта
Важность признаков
Метрика, количественно оценивающая влияние каждой предикторной переменной на производительность модели Random Forest, вычисляемая либо по среднему уменьшению нечистоты, либо путем случайной перестановки.
Важность Джини
Метод оценки важности переменных, основанный на общем уменьшении нечистоты Джини, накопленной во всех узлах, где переменная используется для разделения.
Среднее уменьшение нечистоты
Техника измерения важности переменной по среднему уменьшению нечистоты (Джини или энтропии), которую она обеспечивает при использовании в качестве критерия разделения в деревьях.
Важность перестановки
Метод, независимый от модели, оценивающий важность переменной путем измерения ухудшения производительности модели, когда значения этой переменной случайным образом переставляются.
Среднее снижение точности
Показатель важности переменной, основанный на среднем снижении точности модели, когда эта переменная переставляется в out-of-bag данных.
Мера нечистоты
Математическая функция, количественно оценивающая степень неоднородности классов в узле, используемая для оптимизации разделений в деревьях решений.
Прирост информации
Критерий разделения, измеряющий уменьшение энтропии, получаемое при разделении узла по определенному признаку, способствуя разделениям, которые максимизируют результирующую однородность.
Индекс Джини
Мера нечистоты, вычисляющая вероятность того, что случайно классифицированное наблюдение будет неверным, оценивая неоднородность классов в узле дерева решений.
Ошибка Out-of-Bag
Несмещенная оценка ошибки, вычисляемая путем оценки каждого дерева на наблюдениях, не использованных при его обучении, служащая внутренней перекрестной проверкой в Random Forest.
Отбор признаков
Процесс определения и сохранения наиболее релевантных переменных на основе их оценок важности, устраняющий избыточные или неинформативные признаки.
График важности переменных
Визуализация, упорядочивающая предиктивные переменные по убыванию их оценки важности, облегчающая интерпретацию наиболее влиятельных факторов модели.
График частичной зависимости
Графическое представление, показывающее маргинальный эффект одной или двух переменных на предсказание модели, усредняя по всем остальным переменным.
Неоднородность узла
Степень неоднородности наблюдений в узле дерева, служащая основой для расчета важности признаков через их вклад в снижение этой неоднородности.
Критерий разделения
Правило, определяющее оптимальное разделение узла на основе признака и порогового значения, непосредственно влияющее на распределение важности между переменными.