Глоссарий ИИ
Полный словарь искусственного интеллекта
Learning Rate (Скорость обучения)
Гиперпараметр, контролирующий вклад каждого оценщика в итоговую модель, позволяющий найти компромисс между скоростью сходимости и точностью модели.
Max Depth (Максимальная глубина)
Гиперпараметр, определяющий максимальную глубину каждого дерева решений, контролирующий сложность модели и риск переобучения.
Split Finding (Поиск разбиения)
Алгоритмический процесс поиска наилучшей точки разделения в узле дерева, оптимизированный в XGBoost с помощью структуры данных, называемой гистограммой.
Tree Pruning (Обрезка дерева)
Техника пост-обрезки на основе показателя прироста, которая удаляет ветви дерева, не приносящие положительного прироста потерь, для упрощения модели.
Early Stopping (Ранняя остановка)
Техника регуляризации, которая останавливает обучение, когда производительность на проверочном наборе перестает улучшаться, предотвращая переобучение.
Gamma (min_split_loss)
Гиперпараметр регуляризации, определяющий минимальные потери, необходимые для выполнения нового разделения в узле дерева, контролирующий сложность.
Lambda (L2 регуляризация на весах)
Гиперпараметр L2 регуляризации, применяемый к весам листьев деревьев, уменьшающий их амплитуду для предотвращения переобучения.
Alpha (L1 регуляризация на весах)
Гиперпараметр L1 регуляризации, применяемый к весам листьев деревьев, способствующий разреженности и могущий обнулить некоторые веса.
Scale-Pos-Weight
Гиперпараметр, используемый для несбалансированных задач классификации, который взвешивает положительный класс относительно отрицательного класса.
Parallelization
Способность XGBoost распараллеливать построение деревьев на нескольких ядрах CPU, что значительно ускоряет время обучения.
Cache-Aware Access
Алгоритмическая оптимизация в XGBoost, которая организует доступ к памяти для максимального использования кэша процессора, улучшая производительность.