Глоссарий ИИ
Полный словарь искусственного интеллекта
Атака «белого ящика»
Атака, при которой злоумышленник обладает полным знанием архитектуры модели, её параметров и весов, что позволяет целенаправленно использовать уязвимости.
Метод знака градиента (FGSM)
Техника атаки «белого ящика», использующая градиент функции потерь для генерации противоречивых возмущений за один шаг оптимизации.
Атака L-BFGS
Метод атаки «белого ящика», основанный на алгоритме оптимизации BFGS с ограниченным использованием памяти, для поиска противоречивых примеров с минимальным возмущением.
DeepFool
Алгоритм атаки «белого ящика», вычисляющий минимальное расстояние до границы принятия решений путем линейной аппроксимации классификатора вокруг образца.
Атака Carlini-Wagner
Сложная атака «белого ящика», использующая нелинейную оптимизацию для генерации труднодетектируемых противоречивых примеров с минимальными возмущениями.
Атака на основе карты значимости Якоби (JSMA)
Атака «белого ящика», использующая матрицу Якоби для выявления наиболее влиятельных пикселей и создания целенаправленных и незаметных возмущений.
Проектированный градиентный спуск (PGD)
Итеративный метод атаки «белого ящика», расширяющий FGSM за счет множества шагов градиентного спуска и проекции для ограничения возмущений.
Анализ чувствительности модели
Техника «белого ящика», оценивающая влияние изменений входных данных на выходные данные модели для выявления эксплуатируемых уязвимостей.
Оптимальное Lp-возмущение
Задача оптимизации в модели белого ящика, направленная на поиск наименьшего возмущения по норме Lp (L0, L2 или L∞) для обмана классификатора.
Атака извлечения модели
Атака в модели белого ящика, при которой злоумышленник получает доступ к внутренним параметрам для репликации или кражи полной функциональности обученной модели.
Бэкдор в модели белого ящика
Уязвимость, намеренно внедренная в модель, доступную в режиме белого ящика, активируемая с помощью специфических триггеров, известных злоумышленнику.
Атака инверсии градиента
Атака в модели белого ящика, восстанавливающая исходные обучающие данные путем инверсии градиентов модели, что нарушает конфиденциальность данных.
Метод полного уклонения
Стратегия атаки в модели белого ящика, использующая все знания о модели для создания противоречивых примеров, гарантирующих обход классификатора.
Атака вывода членства
Атака в модели белого ящика, определяющая, входил ли конкретный образец в обучающую выборку, путем анализа детальных ответов модели.
Универсальное возмущение в модели белого ящика
Единое возмущение, сгенерированное в модели белого ящика, способное обмануть модель на широком диапазоне входных данных благодаря полному знанию классификатора.