Interpretabilidad contra-explicativa

📖

términos

Contraejemplo (Counterfactual)

Instancia de datos mínima y modificada respecto a un caso original, que cambia la predicción del modelo hacia una salida deseada, sirviendo para explicar la decisión fronteriza del modelo.

📖

términos

Explicación Contrafáctica (Counterfactual Explanation)

Método de interpretabilidad que explica una predicción presentando un escenario hipotético (contraejemplo) donde la decisión del modelo habría sido diferente, aclarando así los criterios de decisión.

📖

términos

Validez Contrafáctica (Counterfactual Validity)

Criterio que garantiza que un contraejemplo generado produce efectivamente la predicción alternativa esperada por el modelo, asegurando la fiabilidad y pertinencia de la explicación proporcionada.

📖

términos

Proximidad Contrafáctica (Counterfactual Proximity)

Medida de la distancia entre la instancia original y el contraejemplo, frecuentemente cuantificada mediante una norma (ej: L1, L2), con el objetivo de garantizar que la explicación sea plausible y fácilmente interpretable.

📖

términos

Esparsidad Contrafáctica (Counterfactual Sparsity)

Principio según el cual un contraejemplo debe modificar el menor número posible de características de la instancia original para maximizar la claridad y accionabilidad de la explicación.

📖

términos

Plausibilidad Contrafáctica (Counterfactual Plausibility)

Evaluación de la credibilidad de un contraejemplo en el mundo real, asegurando que las modificaciones sugeridas son realizables y no corresponden a una instancia aberrante o imposible.

📖

términos

Diversidad Contrafáctica (Counterfactual Diversity)

Objetivo de generar un conjunto de contraejemplos que no sean redundantes, ofreciendo múltiples caminos alternativos distintos para alcanzar una predicción diferente y enriqueciendo así la comprensión del modelo.

📖

términos

Costo Contrafáctico (Counterfactual Cost)

Función que pondera las modificaciones de características en un contraejemplo, reflejando la dificultad o costo (monetario, temporal, etc.) de realizar estos cambios en la realidad.

📖

términos

Causalidad Contrafáctica

Enfoque avanzado donde los contraejemplos se generan respetando las relaciones causales entre las variables, garantizando que los escenarios propuestos no violen las restricciones del mundo real.

📖

términos

Robustez Contrafáctica

Capacidad de un contraejemplo para mantener su predicción alternativa frente a ligeras variaciones o ruido, indicando la estabilidad del límite de decisión del modelo en esa región.

📖

términos

Generación de Contraejemplos Adversariales

Uso de técnicas de aprendizaje adversarial para crear contraejemplos, frecuentemente con fines de seguridad o auditoría, para probar las vulnerabilidades y puntos débiles de un modelo.

📖

términos

Espacio Latente Contrafáctico

Método que busca contraejemplos en un espacio de representación de menor dimensión (espacio latente) para mejorar la eficiencia computacional y la coherencia de las instancias generadas.

📖

términos

Métodos de Optimización Contrafáctica

Conjunto de algoritmos (ej: programación con restricciones, descenso de gradiente) utilizados para resolver el problema de búsqueda del contraejemplo óptimo minimizando una función de pérdida que combina proximidad y validez.

📖

términos

Explicaciones Contrafácticas Multiclase

Extensión de los contraejemplos a problemas de clasificación con más de dos clases, donde se generan instancias para cambiar a cualquier otra clase objetivo, y no solo a la clase opuesta.

Glosario IA

Contraejemplo (Counterfactual)

Explicación Contrafáctica (Counterfactual Explanation)

Validez Contrafáctica (Counterfactual Validity)

Proximidad Contrafáctica (Counterfactual Proximity)

Esparsidad Contrafáctica (Counterfactual Sparsity)

Plausibilidad Contrafáctica (Counterfactual Plausibility)

Diversidad Contrafáctica (Counterfactual Diversity)

Costo Contrafáctico (Counterfactual Cost)

Causalidad Contrafáctica

Robustez Contrafáctica

Generación de Contraejemplos Adversariales

Espacio Latente Contrafáctico

Métodos de Optimización Contrafáctica

Explicaciones Contrafácticas Multiclase

No se encontraron resultados