Глоссарий ИИ
Полный словарь искусственного интеллекта
Распределение частот
Табличное или графическое представление количества вхождений каждого значения или класса количественной или качественной переменной, позволяющее визуализировать структуру данных.
Гистограмма
График в виде смежных столбцов, представляющий распределение непрерывной количественной переменной, где площадь каждого столбца пропорциональна частоте наблюдений в соответствующем интервале.
Ящик с усами
Статистическая диаграмма, обобщающая распределение переменной через пять показателей: минимум, первый квартиль, медиана, третий квартиль и максимум, выявляющая симметрию и наличие экстремальных значений.
Квартили
Значения, которые делят упорядоченный набор данных на четыре равные части, где Q1 представляет 25-й процентиль, Q2 - медиану (50-й процентиль) и Q3 - 75-й процентиль.
Стандартное отклонение
Мера дисперсии, вычисляемая как квадратный корень из дисперсии, количественно определяющая среднее рассеяние наблюдений вокруг среднего значения распределения.
Дисперсия
Среднее квадратов отклонений от среднего значения, измеряющее рассеяние данных и составляющее основу для расчета стандартного отклонения в одномерном анализе.
Среднее арифметическое
Показатель центральной тенденции, получаемый делением суммы всех наблюдений на их общее количество, чувствительный к экстремальным значениям и подходящий для симметричных данных.
Медиана
Центральное значение, разделяющее упорядоченное распределение на две равные части, устойчивое к экстремальным значениям и особенно информативное для асимметричных распределений.
Мода
Значение или категория, появляющаяся с наибольшей частотой в распределении, которая может быть единственной, множественной или отсутствовать в зависимости от структуры данных.
Размах
Элементарная мера дисперсии, вычисляемая как разница между максимальным и минимальным значениями переменной, дающая первоначальное представление о вариабельности данных.
Коэффициент вариации
Отношение стандартного отклонения к среднему значению, выраженное в процентах, позволяющее сравнивать относительную дисперсию между переменными разных масштабов в одномерном анализе.
Асимметрия
Коэффициент асимметрии, измеряющий степень наклона распределения относительно его симметрии, различающий левосторонние (отрицательные) и правосторонние (положительные) распределения.
Столбчатая диаграмма
Графическое представление качественных или дискретных количественных переменных, где высота каждого столбца пропорциональна частоте или количеству каждой категории.
Круговая диаграмма
График, разделенный на секторы, углы которых пропорциональны относительным частотам качественной переменной, визуализирующий состав целого в процентах.
Диаграмма плотности
Сглаженная кривая, оценивающая функцию плотности вероятности непрерывной переменной, предоставляющая альтернативную визуализацию гистограмме для идентификации мод и формы распределения.
Межквартильный размах
Надежная мера дисперсии, вычисляемая как разница между третьим и первым квартилями (Q3-Q1), представляющая диапазон, содержащий 50% центральных наблюдений.
Коэффициент асимметрии Пирсона
Индекс асимметрии, основанный на разнице между средним и медианой, нормализованный стандартным отклонением, предоставляющий альтернативную интуитивно понятную меру скошенности распределения.
Выбросы
Экстремальные наблюдения, значительно отклоняющиеся от общей структуры данных, идентифицируемые методами как межквартильный размах (1.5×IQR) или Z-оценка.