Глоссарий ИИ
Полный словарь искусственного интеллекта
Атаки white-box
Атаки, при которых злоумышленник полностью знает архитектуру и параметры целевой модели.
Атаки Black-Box
Атаки, выполняемые без знания внутреннего устройства модели, исключительно путем взаимодействия с ее входами и выходами.
Атаки с уклонением
Незначительные возмущения входных данных для обмана модели во время инференса.
Attaques par Empoisonnement
Injection de données malveillantes dans l'ensemble d'entraînement pour compromettre le modèle.
Атаки экстракции модели
Кража параметров или функциональности проприетарной модели с помощью повторных запросов.
Атаки по определению принадлежности
Определение того, входила ли конкретная точка данных в обучающую выборку.
Защита с помощью состязательного обучения
Обучение модели на сгенерированных состязательных примерах для повышения ее устойчивости.
Защита путем обнаружения атак
Механизмы для выявления и отклонения потенциально состязательных входных данных.
Защита посредством маскирования градиентов
Техники, маскирующие градиенты для предотвращения атак, основанных на оптимизации.
Attaques sur Vision par Ordinateur
Attaques spécifiquement conçues pour tromper les modèles de classification d'images et de détection d'objets.
Атаки на NLP
Незначительные текстовые возмущения для обмана моделей обработки естественного языка.
Attaques par Transfert
Attaques générées sur un modèle source mais efficaces contre des modèles cibles différents.
Защита с помощью рандомизации
Введение стохастичности в процесс вывода для нарушения атак
Атаки на аудио модели
Незаметные звуковые возмущения, разработанные для обмана систем распознавания речи.
Оценка устойчивости
Метрики и бенчмарки для количественной оценки устойчивости моделей к состязательным атакам.