Глоссарий ИИ
Полный словарь искусственного интеллекта
Стабильность объяснений
Свойство, измеряющее согласованность объяснений, генерируемых моделью, когда входные данные подвергаются незначительным изменениям, гарантируя надежность интерпретаций в условиях шума.
Чувствительность к возмущениям
Способность объяснительного метода сохранять согласованные результаты, когда входные данные изменяются случайными или структурированными возмущениями.
Атаки на объяснения
Вредоносные методы, предназначенные для манипулирования или ухудшения качества объяснений без обязательного влияния на прогнозирующую производительность базовой модели.
Согласованность объяснений
Качественная мера, оценивающая, являются ли генерируемые объяснения логически совместимыми друг с другом и с знаниями предметной области, обеспечивая последовательную интерпретацию.
Верность объяснений
Степень точности, с которой объяснение аппроксимирует реальное поведение модели локально или глобально, количественно оценивая доверие к предоставленной интерпретации.
Робастность объяснительных моделей
Внутренняя способность объяснительных систем противостоять изменениям входных данных и попыткам манипуляции, сохраняя при этом валидные и надежные интерпретации.
Дисперсия объяснений
Статистическая мера, количественно оценивающая разброс генерируемых объяснений для схожих входных данных, указывающая на стабильность и предсказуемость объяснительной системы.
Непрерывность объяснений
Свойство, гарантирующее, что небольшие модификации во входном пространстве приводят к пропорциональным и постепенным изменениям в производимых объяснениях.
Инвариантность объяснений
Характеристика объяснительного метода, обеспечивающая постоянство результатов при преобразованиях, сохраняющих семантику, таких как повороты или изменения масштаба.
Перекрестная валидация объяснений
Систематическая методология для оценки согласованности и устойчивости объяснений на различных подмножествах данных и конфигурациях модели.
Оценка устойчивости объяснений
Набор стандартизированных метрик и протоколов для систематического количественного определения устойчивости объяснений к возмущениям и атакам состязателей.
Семантические возмущения
Преднамеренные модификации входных данных, которые сохраняют общий смысл, но изменяют поверхностные характеристики, используемые для тестирования устойчивости объяснений.
Атаки переносом объяснений
Стратегии состязателей, использующие сходство между различными моделями или архитектурами для одновременного компрометирования их соответствующих объяснительных систем.
Калибровка объяснений
Процесс систематической корректировки объяснительных оценок или весов для обеспечения надежного соответствия между воспринимаемой важностью и реальным влиянием на прогнозы.
Временная согласованность объяснений
Свойство, измеряющее стабильность объяснений на временных или последовательных данных, обеспечивающее согласованную интерпретацию в различных временных окнах.
Агрегация множественных объяснений
Техника комбинирования нескольких индивидуальных объяснений для создания более устойчивой и стабильной интерпретации, снижающая влияние случайных или смещенных вариаций.
Чувствительность к гиперпараметрам
Мера зависимости генерируемых объяснений от выбора гиперпараметров, оценивающая устойчивость объяснительной системы к собственной конфигурации.
Изотропия объяснений
Свойство, гарантирующее равномерное и несмещенное распределение объяснений в пространстве характеристик, избегая систематических направленных искажений.
Декомпозиция объяснительной неопределенности
Аналитический метод, разделяющий источники неопределенности в объяснениях (эпистемическая, случайная, модельная) для количественной оценки и повышения интерпретационной надежности.