回避攻撃

📖

用語

推論フェーズにおいてAIモデルを欺くために、人間の知覚を変えることなく入力データをわずかに変更する攻撃手法。

📖

用語

DeepFool攻撃

可能な限り最小の摂動で敵対的サンプルを生成するために、決定境界までの最小距離を計算する反復アルゴリズム。

📖

用語

敵対的普遍摂動

各サンプルごとの再計算を必要とせず、広範囲の異なる入力に対してモデルを効果的に欺くことができる単一の摂動。

📖

用語

転移性を利用した攻撃

あるモデルに対して生成された敵対的サンプルが、異なるアーキテクチャを持つ他のモデルに対しても有効であるという現象を悪用する攻撃。

📖

用語

Lp距離による攻撃

知覚可能性を制御するために、異なるノルム（L0、L1、L2、L∞）に基づいて摂動の大きさを測定・制限する攻撃の一群。

📖

用語

スコアベース攻撃

モデルの信頼度スコアを利用して勾配を推定し、効果的な敵対的サンプルを構築するブラックボックス攻撃。

📖

用語

デシジョンベース攻撃

敵対的摂動を生成するために、モデルによって予測された出力ラベルのみを使用する極端なブラックボックス攻撃。

📖

用語

物理的攻撃

現実世界の条件下でAIシステムを欺くために、物理的な物体に敵対的摂動を適用する攻撃。

📖

用語

ゼロデイ攻撃

防御システムがまだ認識していない脆弱性を悪用する攻撃で、従来の検知メカニズムを無効にしてしまうもの。

📖

用語

エンコーディング攻撃

生データではなく、データの符号化表現を変更することで、入力に基づく防御システムを回避する手法。

📖

用語

変換攻撃

入力データに対して幾何学的変換（回転、平行移動など）を適用し、ピクセルを直接変更することなくモデルを欺瞞する攻撃。

📖

用語

EOT攻撃（変換に対する期待値）

可能な変換の分布にわたって最適化を行うことで、ランダムな変動に対して頑健性を持たせる最適化手法。

📖

用語

敵対的オートエンコーダ攻撃

データの本来の意味を維持したまま、知覚できない摂動を生成するためにオートエンコーダを利用する手法。

AI用語集