Robustez de los Modelos
Detección de ejemplos adversariales
Conjunto de técnicas destinadas a identificar automáticamente las entradas potencialmente manipuladas antes de que sean procesadas por el modelo principal. Estos sistemas a menudo utilizan metaclasificadores o análisis estadísticos de las activaciones.
← Volver