Нормализация и стандартизация

📖

термины

Робастное масштабирование

Техника, использующая квантили для устойчивости к выбросам, обычно применяя (x - медиана)/IQR, где IQR представляет межквартильный размах. Этот подход сохраняет стабильность преобразований даже при наличии зашумленных или экстремальных данных.

📖

термины

L1-нормализация

Метод масштабирования, делящий каждое значение на абсолютную сумму всех значений в векторе, гарантируя, что L1-норма равна 1. Это преобразование особенно полезно для вероятностных моделей и разреженных представлений.

📖

термины

L2-нормализация

Процедура нормализации векторов путем деления каждой компоненты на квадратный корень из суммы квадратов, обеспечивая единичную евклидову норму. Эта техника важна для алгоритмов, чувствительных к величине вектора, таких как SVM и нейронные сети.

📖

термины

Квантильная нормализация

Непараметрическая техника, преобразующая данные для следования заданному равномерному или нормальному распределению с использованием функций квантильного распределения. Этот подход особенно эффективен для работы с сильно асимметричными или мультимодальными распределениями.

📖

термины

Масштабирование до единичного вектора

Нормализация, делящая каждый вектор на его евклидову норму, что приводит к векторам единичной длины в многомерном пространстве. Этот метод важен для алгоритмов, основанных на косинусной мере схожести и текстовых представлениях.

📖

термины

Десятичная нормализация

Простая техника, делящая значения на степень 10 для приведения их в интервал [-1,1], основанная на максимальном количестве цифр перед запятой. Этот метод сохраняет относительный порядок величин, уменьшая абсолютный числовой масштаб.

📖

термины

Робастная стандартизация

Вариант стандартизации, использующий медиану и медианное абсолютное отклонение (MAD) как меры центральной тенденции и дисперсии, обеспечивая повышенную устойчивость к выбросам. Этот подход сохраняет интерпретируемость, гарантируя робастность.

📖

термины

Логарифмическое масштабирование

Преобразование, применяющее log(x + c), где c - константа для обработки нулевых значений, эффективно сжимая шкалу больших значений. Этот метод особенно подходит для данных, следующих степенному закону или имеющих правую асимметрию.

📖

термины

Нормализация по рангу

Непараметрическая техника, заменяющая каждое значение его нормализованным рангом в наборе данных, устраняя влияние экстремальных значений. Этот подход устойчив к выбросам и сохраняет только относительный порядок наблюдений.

📖

термины

Стандартизация по медиане

Метод центрирования данных вокруг медианы вместо среднего значения, с делением на устойчивую меру дисперсии, такую как межквартильный размах. Этот подход обеспечивает лучшую устойчивость к асимметричным распределениям и выбросам.

📖

термины

Масштабирование по максимальному абсолютному значению

Простая техника, делящая каждое значение на максимальное абсолютное значение признака, сохраняя знаки и нули, ограничивая значения в диапазоне [-1,1]. Этот метод особенно эффективен для уже центрированных или разреженных данных.

📖

термины

Нормализация по дисперсии

Процедура стандартизации переменных путем деления на их дисперсию, уравнивая таким образом важность каждого признака в алгоритмах, чувствительных к масштабу. Этот подход особенно полезен для анализа главных компонент и гребневой регрессии.

📖

термины

Стандартизация по коэффициенту вариации

Продвинутый метод нормализации данных путем деления на коэффициент вариации (σ/μ), позволяющий сравнивать переменные с разными средними значениями и дисперсиями. Эта техника особенно актуальна для данных, где относительная изменчивость важнее абсолютной изменчивости.

Глоссарий ИИ

Робастное масштабирование

L1-нормализация

L2-нормализация

Квантильная нормализация

Масштабирование до единичного вектора

Десятичная нормализация

Робастная стандартизация

Логарифмическое масштабирование

Нормализация по рангу

Стандартизация по медиане

Масштабирование по максимальному абсолютному значению

Нормализация по дисперсии

Стандартизация по коэффициенту вариации

Результаты не найдены