Атаки экстракции модели

📖

термины

Кража параметров

Процесс, при котором злоумышленник извлекает веса и смещения обученной нейронной сети для создания функциональной копии исходной модели без прямого доступа к файлам.

📖

термины

Извлечение функциональности

Метод, заключающийся в выводе обучающих признаков и внутренних представлений модели путем наблюдения за ее поведением при различных входных данных.

📖

термины

Адверсариальные запросы

Набор входных данных, специально разработанных для проверки границ и поведения модели с целью извлечения конфиденциальной информации об ее архитектуре или параметрах.

📖

термины

Вывод модели

Процесс определения свойств целевой модели (архитектуры, гиперпараметров, обучающих данных) на основе ее прогнозов и ответов на запросы.

📖

термины

Теневое моделирование

Техника, при которой злоумышленник обучает несколько моделей-заместителей для аппроксимации поведения целевой модели, что затем облегчает извлечение ее внутренних характеристик.

📖

термины

Вывод членства

Атака, направленная на определение того, входил ли конкретный образец данных в обучающий набор модели, часто используемая в качестве предварительного этапа перед извлечением.

📖

термины

Атака на основе запросов

Стратегия атаки, основанная исключительно на отправке запросов к API модели для постепенного вывода ее структуры и внутренних параметров.

📖

термины

Атака по извлечению функции

Специализированная атака, направленная на воспроизведение функции принятия решений модели, а не ее точных параметров, путем создания приблизительной модели с эквивалентным поведением.

📖

термины

Извлечение параметров

Продвинутая техника, позволяющая получить точные числовые значения весов нейронной сети на основе наблюдений за ее выходными данными при различных входных данных.

📖

термины

Злоупотребление API

Некорректное использование точек доступа службы ИИ для выполнения чрезмерного количества запросов с целью извлечения информации о базовой модели.

📖

термины

Инверсия модели

Реконструктивная атака, при которой злоумышленник использует выходные данные модели для приблизительного восстановления конфиденциальных обучающих данных, использованных для ее обучения.

📖

термины

Атака с использованием дистилляции знаний

Злонамеренное использование методов дистилляции знаний, при котором целевая модель выступает в роли учителя, а злоумышленник создает модель-ученика, имитирующую ее поведение.

📖

термины

Отпечаток модели

Уникальная идентификация модели по ее отличительным поведенческим характеристикам, что позволяет отследить ее происхождение и облегчить целенаправленное извлечение.

📖

термины

Извлечение в условиях белого ящика

Атака, при которой злоумышленник имеет частичный или полный доступ к архитектуре модели, что значительно облегчает точное извлечение ее параметров и функциональности.

📖

термины

Извлечение в условиях черного ящика

Извлечение модели, выполняемое без предварительного знания внутренней архитектуры, основываясь исключительно на наблюдаемых отношениях «вход-выход» через API.

📖

термины

Атака «Оракул»

Метод атаки, рассматривающий целевую модель как оракул, дающий ответы на вопросы, и использующий эти ответы для постепенного восстановления ее внутренней логики.

📖

термины

Output Space Analysis

Analyse systématique de l'espace des sorties d'un modèle pour identifier des patterns et relations permettant de déduire sa structure interne et ses paramètres.

Глоссарий ИИ

Кража параметров

Извлечение функциональности

Адверсариальные запросы

Вывод модели

Теневое моделирование

Вывод членства

Атака на основе запросов

Атака по извлечению функции

Извлечение параметров

Злоупотребление API

Инверсия модели

Атака с использованием дистилляции знаний

Отпечаток модели

Извлечение в условиях белого ящика

Извлечение в условиях черного ящика

Атака «Оракул»

Output Space Analysis

Результаты не найдены