Глоссарий ИИ
Полный словарь искусственного интеллекта
Преобразование числовых переменных
Применение математических преобразований к непрерывным переменным для улучшения их распределения и связи с целевой переменной.
Кодирование Категориальных Переменных
Преобразование текстовых или категориальных данных в числовой формат, пригодный для алгоритмов машинного обучения.
Управление пропущенными значениями
Методы импутации и обработки отсутствующих данных для сохранения целостности набора данных.
Создание временных характеристик
Извлечение и генерация переменных на основе времени из временных или последовательных данных.
Извлечение Текстовых Признаков
Преобразование неструктурированного текста в числовые векторы с помощью таких методов, как TF-IDF, эмбеддинги и n-граммы.
Геопространственная инженерия
Создание переменных из данных о местоположении и географических координатах для выявления пространственных взаимосвязей.
Нормализация и стандартизация
Масштабирование переменных для сопоставимости и оптимальной сходимости алгоритмов обучения.
Выбор Признаков
Идентификация и сохранение наиболее релевантных переменных для улучшения производительности и снижения сложности.
Снижение размерности
Методы, такие как PCA и t-SNE, для сжатия информации с сохранением важных вариаций.
Создание взаимодействий
Генерация новых характеристик путем мультипликативной или аддитивной комбинации существующих переменных.
Преобразование распределений
Применение логарифмических преобразований, Бокса-Кокса или Йео-Джонсона для нормализации асимметричных распределений.
Извлечение характеристик изображений
Преобразование визуальных данных в числовые дескрипторы с помощью гистограмм, текстур и локальных дескрипторов.
Аудиоинжиниринг характеристик
Извлечение спектральных и временных характеристик, таких как MFCC, хрома и спектрограммы, из аудиосигналов.
Временная агрегация
Создание скользящей статистики и агрегатов по временным окнам для выявления тенденций и паттернов.
Полиномиальные характеристики
Генерация членов высшего порядка для улавливания нелинейных отношений между переменными.
Биннинг и Дискретизация
Разделение непрерывных переменных на дискретные интервалы для захвата нелинейных эффектов и снижения шума.
Инжиниринг временных рядов
Создание лаговых признаков, скользящих средних и сезонных декомпозиций для моделирования временных зависимостей.
Извлечение Характеристик Графов
Генерация дескрипторов из структур сетей, таких как центральность, кластеризация и эмбеддинги узлов.