Атаки с противодействием и защита

📂

подкатегории

Атаки white-box

Атаки, при которых злоумышленник полностью знает архитектуру и параметры целевой модели.

15 термины

📂

подкатегории

Атаки Black-Box

Атаки, выполняемые без знания внутреннего устройства модели, исключительно путем взаимодействия с ее входами и выходами.

18 термины

📂

подкатегории

Атаки с уклонением

Незначительные возмущения входных данных для обмана модели во время инференса.

13 термины

📂

подкатегории

Attaques par Empoisonnement

Injection de données malveillantes dans l'ensemble d'entraînement pour compromettre le modèle.

17 термины

📂

подкатегории

Атаки экстракции модели

Кража параметров или функциональности проприетарной модели с помощью повторных запросов.

17 термины

📂

подкатегории

Атаки по определению принадлежности

Определение того, входила ли конкретная точка данных в обучающую выборку.

11 термины

📂

подкатегории

Защита с помощью состязательного обучения

Обучение модели на сгенерированных состязательных примерах для повышения ее устойчивости.

15 термины

📂

подкатегории

Защита путем обнаружения атак

Механизмы для выявления и отклонения потенциально состязательных входных данных.

18 термины

📂

подкатегории

Защита посредством маскирования градиентов

Техники, маскирующие градиенты для предотвращения атак, основанных на оптимизации.

17 термины

📂

подкатегории

Attaques sur Vision par Ordinateur

Attaques spécifiquement conçues pour tromper les modèles de classification d'images et de détection d'objets.

8 термины

📂

подкатегории

Атаки на NLP

Незначительные текстовые возмущения для обмана моделей обработки естественного языка.

17 термины

📂

подкатегории

Attaques par Transfert

Attaques générées sur un modèle source mais efficaces contre des modèles cibles différents.

16 термины

📂

подкатегории

Защита с помощью рандомизации

Введение стохастичности в процесс вывода для нарушения атак

16 термины

📂

подкатегории

Атаки на аудио модели

Незаметные звуковые возмущения, разработанные для обмана систем распознавания речи.

20 термины

📂

подкатегории

Оценка устойчивости

Метрики и бенчмарки для количественной оценки устойчивости моделей к состязательным атакам.

17 термины

Глоссарий ИИ

Атаки white-box

Атаки Black-Box

Атаки с уклонением

Attaques par Empoisonnement

Атаки экстракции модели

Атаки по определению принадлежности

Защита с помощью состязательного обучения

Защита путем обнаружения атак

Защита посредством маскирования градиентов

Attaques sur Vision par Ordinateur

Атаки на NLP

Attaques par Transfert

Защита с помощью рандомизации

Атаки на аудио модели

Оценка устойчивости

Результаты не найдены