Метрики оценки интерпретируемости
Робастность объяснения
Способность объяснения сохранять свою валидность перед лицом возмущений или атак на входные данные. Эта метрика оценивает устойчивость объяснений к злонамеренным манипуляциям, направленным на введение в заблуждение.
← Назад