AI用語集
人工知能の完全辞典
ブラックボックス攻撃
ターゲットモデルの内部アーキテクチャ、重み、またはハイパーパラメータに関する知識なしで行われる敵対的攻撃。攻撃者はモデルの入力と出力とのみ対話できます。
転移攻撃
ソースモデルに対して生成された敵対的サンプルを使用して、異なるターゲットモデルを欺く手法。類似したデータでトレーニングされたモデル間の決定境界の類似性を利用します。
クエリベース攻撃
モデルの応答を観察し、敵対的サンプルを徐々に調整するために複数のリクエストを送信する反復的な攻撃手法。許可されたクエリの予算によって制限されます。
モデル抽出
継続的にクエリを行うことで、独自のモデルを複製または近似することを目的としたプロセス。後続の攻撃のために代替モデルを作成することを可能にします。
逆決定攻撃
モデルの決定から内部特徴やトレーニングデータを再構築しようとするアプローチ。モデルの出力によって漏洩する情報を悪用します。
境界攻撃
ターゲットモデルの決定境界に近いインスタンスに焦点を当てた攻撃。分類を変更するために必要な最小限の摂動を見つけようとします。
代替モデル攻撃
ターゲットモデルの動作を模倣するために、ローカルで代替モデルをトレーニングする戦略。その後、代替モデルを使用して敵対的サンプルを生成します。
オラクル攻撃
ターゲットモデルが信頼度確率を提供しない場合に、外部のオラクルを使用して攻撃の成功を評価する手法。バイナリ(二値)または定性的な応答に依存します。
勾配近似攻撃
有限差分法や数値的手法を用いてターゲットモデルの勾配を推定する手法。勾配への直接アクセスなしで勾配ベースの攻撃を適用可能にする。
微分進化攻撃
突然変異や交叉オペレータを使用して敵対的例を見つけるメタヒューリスティック最適化アルゴリズム。複雑な探索空間において特に有効。
グリッドサーチ攻撃
事前に定義されたグリッドに従って摂動空間を探索する体系的なアプローチ。単純だが、次元の呪いにより高次元では非効率になることが多い。
ベイズ最適化攻撃
目的関数の確率モデルを構築して敵対的例の探索を導く大域的最適化手法。クエリ回数が制限されている場合に有効。
強化学習攻撃
エージェントがターゲットモデルとの相互作用を通じて敵対的摂動の生成を学習するフレームワーク。問題をマルコフ決定過程として定式化する。
ZOO攻撃
敵対的例を見つけるためにゼロ次最適化を適用するZeroth Order Optimizationアルゴリズム。ランダムな座標差分を用いて勾配を推定する。
NES攻撃
ブラックボックス敵対的攻撃に適用されたNatural Evolution Strategy。最適化のためにガウス分布からのサンプリングによる勾配推定を使用する。
Square攻撃
勾配ベースの防御から逃れるためにランダムな正方形の摂動を使用するスコアベースの攻撃。ランダム化されたモデルに対して特に有効。
HopSkipJump攻撃
予測されたクラスへのアクセスのみを必要とする決定ベースの攻撃アルゴリズムです。決定境界に向かって段階的なジャンプによる探索を使用します。
境界攻撃
決定境界に沿って進み、最小限の摂動を持つ敵対的例を見つけるための反復的な手法です。最終的な予測へのアクセスのみを必要とします。