Атаки white-box - Глоссарий ИИ

📖

термины

Атака «белого ящика»

Атака, при которой злоумышленник обладает полным знанием архитектуры модели, её параметров и весов, что позволяет целенаправленно использовать уязвимости.

📖

термины

Метод знака градиента (FGSM)

Техника атаки «белого ящика», использующая градиент функции потерь для генерации противоречивых возмущений за один шаг оптимизации.

📖

термины

Атака L-BFGS

Метод атаки «белого ящика», основанный на алгоритме оптимизации BFGS с ограниченным использованием памяти, для поиска противоречивых примеров с минимальным возмущением.

📖

термины

DeepFool

Алгоритм атаки «белого ящика», вычисляющий минимальное расстояние до границы принятия решений путем линейной аппроксимации классификатора вокруг образца.

📖

термины

Атака Carlini-Wagner

Сложная атака «белого ящика», использующая нелинейную оптимизацию для генерации труднодетектируемых противоречивых примеров с минимальными возмущениями.

📖

термины

Атака на основе карты значимости Якоби (JSMA)

Атака «белого ящика», использующая матрицу Якоби для выявления наиболее влиятельных пикселей и создания целенаправленных и незаметных возмущений.

📖

термины

Проектированный градиентный спуск (PGD)

Итеративный метод атаки «белого ящика», расширяющий FGSM за счет множества шагов градиентного спуска и проекции для ограничения возмущений.

📖

термины

Анализ чувствительности модели

Техника «белого ящика», оценивающая влияние изменений входных данных на выходные данные модели для выявления эксплуатируемых уязвимостей.

📖

термины

Оптимальное Lp-возмущение

Задача оптимизации в модели белого ящика, направленная на поиск наименьшего возмущения по норме Lp (L0, L2 или L∞) для обмана классификатора.

📖

термины

Атака извлечения модели

Атака в модели белого ящика, при которой злоумышленник получает доступ к внутренним параметрам для репликации или кражи полной функциональности обученной модели.

📖

термины

Бэкдор в модели белого ящика

Уязвимость, намеренно внедренная в модель, доступную в режиме белого ящика, активируемая с помощью специфических триггеров, известных злоумышленнику.

📖

термины

Атака инверсии градиента

Атака в модели белого ящика, восстанавливающая исходные обучающие данные путем инверсии градиентов модели, что нарушает конфиденциальность данных.

📖

термины

Метод полного уклонения

Стратегия атаки в модели белого ящика, использующая все знания о модели для создания противоречивых примеров, гарантирующих обход классификатора.

📖

термины

Атака вывода членства

Атака в модели белого ящика, определяющая, входил ли конкретный образец в обучающую выборку, путем анализа детальных ответов модели.

📖

термины

Универсальное возмущение в модели белого ящика

Единое возмущение, сгенерированное в модели белого ящика, способное обмануть модель на широком диапазоне входных данных благодаря полному знанию классификатора.

Глоссарий ИИ

Атака «белого ящика»

Метод знака градиента (FGSM)

Атака L-BFGS

DeepFool

Атака Carlini-Wagner

Атака на основе карты значимости Якоби (JSMA)

Проектированный градиентный спуск (PGD)

Анализ чувствительности модели

Оптимальное Lp-возмущение

Атака извлечения модели

Бэкдор в модели белого ящика

Атака инверсии градиента

Метод полного уклонения

Атака вывода членства

Универсальное возмущение в модели белого ящика

Результаты не найдены