Глоссарий ИИ
Полный словарь искусственного интеллекта
Якоря (Anchors)
Метод локального объяснения, который предоставляет простые и достаточные правила принятия решений (якоря), которые с вероятностной гарантией обеспечивают то же самое предсказание для окрестности наблюдения, предлагая более стабильную интерпретацию, чем LIME.
Значения Шэпли
Основная теоретическая концепция SHAP, представляющая средний маржинальный вклад признака через все возможные коалиции признаков в модели, обеспечивающая справедливое распределение важности.
Объяснение с помощью локального суррогата
Подход, который обучает простую и интерпретируемую модель (такую как дерево решений или линейную регрессию) для аппроксимации поведения сложной модели только в ограниченной окрестности конкретного предсказания.
Окрестность наблюдения
Пространство данных, определенное вокруг конкретного наблюдения, используемое методами локальной интерпретации для генерации вариаций и аппроксимации поведения модели в этой ограниченной области.
Локальная верность (Local Fidelity)
Метрика, оценивающая точность, с которой локальное объяснение (как модель-суррогат) воспроизводит предсказания исходной модели в окрестности объясняемого наблюдения.
TreeSHAP
Вариант алгоритма SHAP, оптимизированный для моделей на основе деревьев решений, способный вычислять точные значения Шэпли гораздо быстрее, используя внутреннюю структуру этих моделей.
KernelSHAP
Реализация SHAP, которая использует функцию взвешивания (ядро) для приблизительной оценки значений Шэпли, делая ее применимой к любой модели агностически, но с более высокими вычислительными затратами.
DeepSHAP
Адаптация SHAP, специально разработанная для моделей глубокого обучения, которая объединяет значения Шэпли с техниками обратного распространения (backpropagation) для эффективного вычисления атрибуций признаков.
Специальное объяснение
Локальное объяснение, сгенерированное специально для одного экземпляра, не претендующее на обобщение, в отличие от глобальных объяснений, которые стремятся описать общее поведение модели.
Влияние локального признака
Мера воздействия конкретного признака на прогноз для одного наблюдения, количественно оценивающая, как изменение этого признака модифицирует результат модели для данного конкретного случая.
Диагностика индивидуального прогноза
Полный процесс анализа одного прогноза с использованием различных локальных методов (LIME, SHAP, контрфактуалы) для понимания лежащих в основе механизмов, валидации решения и выявления потенциальных предубеждений.
Стабильность локального объяснения
Свойство метода локальной интерпретации давать согласованные объяснения для очень похожих наблюдений, критически важный аспект для доверия и надежности индивидуальных диагнозов.
Интегрированные градиенты (Integrated Gradients)
Метод локальной атрибуции для дифференцируемых моделей, который вычисляет важность признака путем интегрирования градиента вывода относительно этого признака вдоль пути от базовой точки до входа.
Базовая линия (Baseline)
Точка отсчета (часто нулевой вектор или средний экземпляр), используемая в методах атрибуции, таких как интегрированные градиенты, для измерения вклада признака относительно нейтрального или ожидаемого состояния.