Методы локальной интерпретации

📖

термины

Якоря (Anchors)

Метод локального объяснения, который предоставляет простые и достаточные правила принятия решений (якоря), которые с вероятностной гарантией обеспечивают то же самое предсказание для окрестности наблюдения, предлагая более стабильную интерпретацию, чем LIME.

📖

термины

Значения Шэпли

Основная теоретическая концепция SHAP, представляющая средний маржинальный вклад признака через все возможные коалиции признаков в модели, обеспечивающая справедливое распределение важности.

📖

термины

Объяснение с помощью локального суррогата

Подход, который обучает простую и интерпретируемую модель (такую как дерево решений или линейную регрессию) для аппроксимации поведения сложной модели только в ограниченной окрестности конкретного предсказания.

📖

термины

Окрестность наблюдения

Пространство данных, определенное вокруг конкретного наблюдения, используемое методами локальной интерпретации для генерации вариаций и аппроксимации поведения модели в этой ограниченной области.

📖

термины

Локальная верность (Local Fidelity)

Метрика, оценивающая точность, с которой локальное объяснение (как модель-суррогат) воспроизводит предсказания исходной модели в окрестности объясняемого наблюдения.

📖

термины

TreeSHAP

Вариант алгоритма SHAP, оптимизированный для моделей на основе деревьев решений, способный вычислять точные значения Шэпли гораздо быстрее, используя внутреннюю структуру этих моделей.

📖

термины

KernelSHAP

Реализация SHAP, которая использует функцию взвешивания (ядро) для приблизительной оценки значений Шэпли, делая ее применимой к любой модели агностически, но с более высокими вычислительными затратами.

📖

термины

DeepSHAP

Адаптация SHAP, специально разработанная для моделей глубокого обучения, которая объединяет значения Шэпли с техниками обратного распространения (backpropagation) для эффективного вычисления атрибуций признаков.

📖

термины

Специальное объяснение

Локальное объяснение, сгенерированное специально для одного экземпляра, не претендующее на обобщение, в отличие от глобальных объяснений, которые стремятся описать общее поведение модели.

📖

термины

Влияние локального признака

Мера воздействия конкретного признака на прогноз для одного наблюдения, количественно оценивающая, как изменение этого признака модифицирует результат модели для данного конкретного случая.

📖

термины

Диагностика индивидуального прогноза

Полный процесс анализа одного прогноза с использованием различных локальных методов (LIME, SHAP, контрфактуалы) для понимания лежащих в основе механизмов, валидации решения и выявления потенциальных предубеждений.

📖

термины

Стабильность локального объяснения

Свойство метода локальной интерпретации давать согласованные объяснения для очень похожих наблюдений, критически важный аспект для доверия и надежности индивидуальных диагнозов.

📖

термины

Интегрированные градиенты (Integrated Gradients)

Метод локальной атрибуции для дифференцируемых моделей, который вычисляет важность признака путем интегрирования градиента вывода относительно этого признака вдоль пути от базовой точки до входа.

📖

термины

Базовая линия (Baseline)

Точка отсчета (часто нулевой вектор или средний экземпляр), используемая в методах атрибуции, таких как интегрированные градиенты, для измерения вклада признака относительно нейтрального или ожидаемого состояния.

Глоссарий ИИ

Якоря (Anchors)

Значения Шэпли

Объяснение с помощью локального суррогата

Окрестность наблюдения

Локальная верность (Local Fidelity)

TreeSHAP

KernelSHAP

DeepSHAP

Специальное объяснение

Влияние локального признака

Диагностика индивидуального прогноза

Стабильность локального объяснения

Интегрированные градиенты (Integrated Gradients)

Базовая линия (Baseline)

Результаты не найдены