Этическая устойчивость
Этическое возмущение
Тонкое изменение входных данных или параметров, направленное конкретно на компрометацию механизмов принятия этических решений системой ИИ. Эти атаки нацелены на слои морального суждения, чтобы вызвать поведение, не соответствующее запрограммированным ценностям.
← Назад