Glosario IA
El diccionario completo de la Inteligencia Artificial
Contraejemplo (Counterfactual)
Instancia de datos mínima y modificada respecto a un caso original, que cambia la predicción del modelo hacia una salida deseada, sirviendo para explicar la decisión fronteriza del modelo.
Explicación Contrafáctica (Counterfactual Explanation)
Método de interpretabilidad que explica una predicción presentando un escenario hipotético (contraejemplo) donde la decisión del modelo habría sido diferente, aclarando así los criterios de decisión.
Validez Contrafáctica (Counterfactual Validity)
Criterio que garantiza que un contraejemplo generado produce efectivamente la predicción alternativa esperada por el modelo, asegurando la fiabilidad y pertinencia de la explicación proporcionada.
Proximidad Contrafáctica (Counterfactual Proximity)
Medida de la distancia entre la instancia original y el contraejemplo, frecuentemente cuantificada mediante una norma (ej: L1, L2), con el objetivo de garantizar que la explicación sea plausible y fácilmente interpretable.
Esparsidad Contrafáctica (Counterfactual Sparsity)
Principio según el cual un contraejemplo debe modificar el menor número posible de características de la instancia original para maximizar la claridad y accionabilidad de la explicación.
Plausibilidad Contrafáctica (Counterfactual Plausibility)
Evaluación de la credibilidad de un contraejemplo en el mundo real, asegurando que las modificaciones sugeridas son realizables y no corresponden a una instancia aberrante o imposible.
Diversidad Contrafáctica (Counterfactual Diversity)
Objetivo de generar un conjunto de contraejemplos que no sean redundantes, ofreciendo múltiples caminos alternativos distintos para alcanzar una predicción diferente y enriqueciendo así la comprensión del modelo.
Costo Contrafáctico (Counterfactual Cost)
Función que pondera las modificaciones de características en un contraejemplo, reflejando la dificultad o costo (monetario, temporal, etc.) de realizar estos cambios en la realidad.
Causalidad Contrafáctica
Enfoque avanzado donde los contraejemplos se generan respetando las relaciones causales entre las variables, garantizando que los escenarios propuestos no violen las restricciones del mundo real.
Robustez Contrafáctica
Capacidad de un contraejemplo para mantener su predicción alternativa frente a ligeras variaciones o ruido, indicando la estabilidad del límite de decisión del modelo en esa región.
Generación de Contraejemplos Adversariales
Uso de técnicas de aprendizaje adversarial para crear contraejemplos, frecuentemente con fines de seguridad o auditoría, para probar las vulnerabilidades y puntos débiles de un modelo.
Espacio Latente Contrafáctico
Método que busca contraejemplos en un espacio de representación de menor dimensión (espacio latente) para mejorar la eficiencia computacional y la coherencia de las instancias generadas.
Métodos de Optimización Contrafáctica
Conjunto de algoritmos (ej: programación con restricciones, descenso de gradiente) utilizados para resolver el problema de búsqueda del contraejemplo óptimo minimizando una función de pérdida que combina proximidad y validez.
Explicaciones Contrafácticas Multiclase
Extensión de los contraejemplos a problemas de clasificación con más de dos clases, donde se generan instancias para cambiar a cualquier otra clase objetivo, y no solo a la clase opuesta.