倫理的堅牢性
倫理的摂動
AIシステムの倫理的意思決定メカニズムを損なうことを目的とした、入力やパラメータの微妙な修正。これらの攻撃は、プログラムされた価値に適合しない動作を誘発するために、道徳的判断の層を標的とする。
← 戻るAIシステムの倫理的意思決定メカニズムを損なうことを目的とした、入力やパラメータの微妙な修正。これらの攻撃は、プログラムされた価値に適合しない動作を誘発するために、道徳的判断の層を標的とする。
← 戻る