Метрики оценки интерпретируемости
Устойчивость объяснения (Explanation Robustness)
Измеряет вариации объяснений, когда модель или входные данные подвергаются атакам противника или шуму, оценивая сопротивляемость интерпретации манипуляциям.
← Назад