ロバスト性の評価

📖

用語

ロバスト精度

ある摂動の範囲内で生成された敵対的例に対するモデルのパフォーマンスを評価し、攻撃に対する耐性を測定する指標です。この指標は、従来の精度と摂動制約下での評価を組み合わせ、パフォーマンスの低下を定量化します。

📖

用語

攻撃距離

敵対的攻撃がモデルを欺くのに成功するために必要な最小限の摂動を定量的に測定したもので、通常は異なるノルム（L0、L1、L2、L∞）に基づいて計算されます。この指標により、同じタイプの攻撃に対する異なるモデル間の相対的なロバスト性を比較することができます。

📖

用語

ロバストスコア

様々な敵対的攻撃に対するモデルの全体的な耐性を評価する、0から1の間で正規化された複合指標です。このスコアは複数のロバスト性指標を集約し、モデルのセキュリティを総合的に評価します。

📖

用語

CLEVER指標

リプシッツ勾配に基づく局所的なロバスト性の推定スコアであり、特定の攻撃を行わずにモデルの攻撃耐性の下界を評価することができます。CLEVER（Cross Lipschitz Extreme Value for nEtwork Robustness）は、ディープニューラルネットワークの証明可能なロバスト性を評価するのに特に有効です。

📖

用語

AutoAttackベンチマーク

複数の攻撃（APGD-CE、APGD-T、FAB、Square）を組み合わせ、モデルの耐性について堅牢で信頼性の高い評価を提供する自動化された標準評価スイートです。AutoAttackは、攻撃の効率を最大化し、グラディエントマスキングを最小化するためにパラメータを動的に調整します。

📖

用語

局所ロバスト性評価

特定のサンプル周辺の特定の近傍におけるモデルの耐性を分析し、その領域内のすべての摂動に対して予測が一定であるかどうかを判定するものです。この評価は、集計されたレベルではなく、個別のレベルでのモデルの挙動を理解するために重要です。

📖

用語

大域ロバスト性評価

入力分布全体におけるモデルの耐性を測定し、大規模なデータサンプルに対する攻撃時の平均パフォーマンスを評価するものです。このアプローチは、実際の使用環境下におけるモデルのセキュリティの巨視的な視点を提供します。

📖

用語

ロバストマージン

モデルの決定境界と入力サンプル間の最小距離であり、予測の変更が発生するまでのセーフティマージンを定量化します。この指標は、モデルの決定の幾何学的な安定性を理解するために不可欠です。

📖

用語

敵対的安全性スコア

様々な敵対的攻撃のファミリーに対するモデルの保護レベルを評価する標準化された指標。通常、攻撃の深刻度をそれらの発生確率で重み付けします。このスコアは、異なるモデルアーキテクチャの相対的な安全性を客観的に比較するのに役立ちます。

📖

用語

堅牢性スケール

敵対的攻撃に対するモデルの耐性レベルに基づいてモデルを分類するための標準化されたシステム。通常、複数のレベル（低、中、高、認証済み）に分かれています。この尺度は、研究者と実務家の間でモデルの堅牢性に関するコミュニケーションを容易にします。

📖

用語

脆弱性指数

モデルの敵対的攻撃に対する感度を測定する定量的な指標。攻撃下での低下したパフォーマンスと公称パフォーマンスの比率として計算されます。指数が高いほど脆弱性が高いことを示し、指数が低いほど耐性が高いことを示唆します。

📖

用語

攻撃成功率

敵対的攻撃がモデルの予測を変更することに成功したサンプルの割合。特定のモデルに対する攻撃の有効性を直接測定します。この指標は、モデルの安全性を完全に評価するために、ロバスト精度を補完するものです。

📖

用語

最大許容摂動

モデルが予測を変更することなく許容できる最大の摂動のしきい値。制御された条件下で堅牢性を評価するための基準として機能します。この測定は、モデルの運用上の安全性制約を定義するために不可欠です。

📖

用語

経験的堅牢性評価

モデルの耐性をテストするために特定の敵対的攻撃を生成することに基づく評価方法論。実用的な測定値を提供しますが、形式的な保証はありません。このアプローチは、実際の攻撃シナリオを反映しているため、広く使用されています。

📖

用語

RobustBenchベンチマーク

画像分類モデルの堅牢性を評価するための標準化されたリファレンスプラットフォーム。厳格な評価プロトコルと比較ランキングを提供します。RobustBenchは、認定された堅牢なモデルのリストとコミュニティによって認められた評価指標を維持しています。

📖

用語

Lp距離メトリック

敵対的摂動の振幅を定量化するために使用される数学的ノルム。ここで、pは異なるタイプの変更を測定するために異なる値（0、1、2、∞）を取ることができます。Lpノルムの選択は、考慮される摂動の性質に応じて、堅牢性の評価に大きな影響を与えます。

📖

用語

形式的ロバスト性評価

指定された領域内のあらゆる可能な摂動に対して保証を証明することにより、モデルのロバスト性を検証する数学的に厳密なアプローチ。経験的手法とは異なり、形式的評価は絶対的な確実性を提供するが、計算コストが高くなることが多い。

AI用語集