Глоссарий ИИ
Полный словарь искусственного интеллекта
Лес вращений
Метод ансамбля, который строит деревья решений на наборах признаков, преобразованных с помощью анализа главных компонент (PCA), для максимизации разнообразия между базовыми классификаторами.
PCA на подмножествах
Применение анализа главных компонент к случайным разбиениям пространства признаков, создавая различные оси проекции для каждого классификатора леса.
Матрица вращения
Ортогональная матрица, полученная из PCA, используемая для проецирования данных в новое пространство признаков, обеспечивая декорреляцию и разнообразие предсказаний деревьев.
Разнообразие классификаторов
Основной принцип ансамблевых методов, направленный на максимизацию различий в предсказаниях между базовыми моделями для снижения общей дисперсии и улучшения обобщения.
Бэггинг с преобразованием
Расширение Bootstrap Aggregating, где bootstrap-выборки подвергаются преобразованию пространства признаков перед обучением каждой базовой модели.
Выбор признаков по группам
Техника разбиения переменных на непересекающиеся подмножества, к которым применяются независимые преобразования, увеличивая гетерогенность классификаторов.
K-кратное разделение признаков
Стратегия разделения признаков на K групп для Rotation Forest, где каждая группа преобразуется отдельно перед рекомбинацией для формирования итогового набора признаков.
Расширенное пространство признаков
Новое пространство представлений, созданное путем конкатенации главных компонент, полученных из каждого подмножества признаков, сохраняя всю исходную информацию при увеличении разнообразия.
Дерево решений на спроецированных данных
Базовый классификатор в Rotation Forest, обученный на данных, предварительно спроецированных в пространство, преобразованное с помощью PCA, где узлы решений работают с линейными комбинациями исходных признаков.
Коэффициенты вращения
Параметры ортогональной матрицы преобразования, которые определяют, как каждый исходный признак вносит вклад в новые главные компоненты для конкретного дерева в лесу.
Объяснённая дисперсия по компонентам
Метрика, полученная в результате PCA, указывающая на долю полной дисперсии данных, захватываемой каждой главной компонентой, влияющая на качество преобразования в Rotation Forest.
Ортогонализация признаков
Математический процесс, обеспечивающий линейную независимость между созданными новыми признаками, необходимый для избежания избыточности и максимизации разнообразия в ансамблях.
Гетерогенный ансамбль
Коллекция базовых классификаторов, работающих в различных пространствах признаков, как в Rotation Forest, где каждое дерево видит уникальное вращение входных данных.
Снижение ковариации
Цель Rotation Forest, направленная на минимизацию ковариации между ошибками различных классификаторов, заставляя их работать с декоррелированными представлениями данных.
Локальная линейная проекция
Преобразование, специфичное для каждого дерева в лесу, применяемое только к подмножеству признаков, создающее уникальную перспективу данных для этого конкретного классификатора.
Стабильность PCA
Устойчивость разложения на главные компоненты к вариациям в обучающих данных, критически важный фактор для производительности и согласованности Rotation Forest.
Гиперпараметр группы
Параметр, контролирующий количество признаков в каждой группе в алгоритме Rotation Forest, напрямую влияющий на баланс между разнообразием классификаторов и сохраняемой информацией в каждом преобразовании.