Глоссарий ИИ
Полный словарь искусственного интеллекта
Таблица сопряженности
Двумерная матрица, представляющая совместное распределение двух категориальных переменных с наблюдаемыми частотами в каждой ячейке, пересекающей категории.
Критерий хи-квадрат
Непараметрический статистический критерий, оценивающий связь между категориальными переменными путем сравнения наблюдаемых частот с ожидаемыми частотами при нулевой гипотезе.
Степени свободы
Статистический параметр, рассчитываемый как (количество строк - 1) × (количество столбцов - 1) в таблице сопряженности, определяющий эталонное распределение критерия.
p-значение
Вероятность получения статистики критерия, по крайней мере столь же экстремальной, как наблюдаемая, при нулевой гипотезе об отсутствии связи между переменными.
Критерий независимости
Специфическое применение критерия хи-квадрат для проверки статистической независимости двух категориальных переменных в изучаемой популяции.
Критерий согласия
Вариант критерия хи-квадрат, сравнивающий наблюдаемое распределение с заданным теоретическим распределением для оценки соответствия данных ожидаемой модели.
Перекрестная таблица
Табличное представление, обобщающее отношения между категориальными переменными, включая абсолютные, относительные частоты и маргинальные значения для каждой категории.
Наблюдаемая частота
Фактическое количество индивидов в каждой ячейке таблицы сопряженности, соответствующее необработанным данным, собранным в выборке.
Ожидаемая частота
Теоретическая частота в каждой ячейке при нулевой гипотезе, рассчитываемая как (сумма строки × сумма столбца) / общий объём выборки.
Коэффициент сопряжённости
Мера связи между категориальными переменными, производная от хи-квадрат, варьирующаяся от 0 до максимального значения, зависящего от размера таблицы.
V Крамера
Стандартизированный коэффициент связи, варьирующийся от 0 до 1, измеряющий силу связи между категориальными переменными путём корректировки хи-квадрат на размер выборки.
Точный критерий Фишера
Альтернативный критерий хи-квадрат для малых выборок, вычисляющий точную вероятность наблюдаемого распределения при нулевой гипотезе о независимости.
Стандартизированные остатки
Разности между наблюдаемыми и ожидаемыми частотами, нормированные на их стандартное отклонение, идентифицирующие ячейки, вносящие наибольший вклад в общую зависимость.
Таблица маргинальных частот
Сводка таблицы сопряжённости, представляющая итоги по строкам и столбцам, необходимые для расчёта ожидаемых частот и условных пропорций.
Теоретическая частота
Ожидаемое значение в каждой ячейке, если переменные были независимы, служащее эталоном для оценки значительных отклонений в анализе.
Хи-квадрат Пирсона
Фундаментальная статистика критерия, рассчитываемая как сумма квадратов нормированных отклонений между наблюдаемыми и теоретическими частотами, следующая распределению хи-квадрат.
Тест Мак-Немара
Специализированный статистический тест для парных дихотомических данных, оценивающий изменения пропорций между двумя временными измерениями на одной и той же выборке.
Поправка Йейтса
Поправка на непрерывность, применяемая к хи-квадрат для таблиц 2×2 с малыми частотами, уменьшающая наблюдаемые частоты на 0.5 для улучшения аппроксимации.
Таблица вероятностей
Совместное распределение вероятностей для каждой комбинации категорий, нормированное по общему размеру выборки для облегчения интерпретации.