Evaluación cuantitativa de la interpretabilidad

📖

términos

Estabilidad (Stability)

Medida de la coherencia de las explicaciones generadas para instancias similares o para la misma instancia con ligeras variaciones de datos. Una baja estabilidad puede indicar una explicación no robusta o un modelo inestable.

📖

términos

Infidelidad (Infidelity)

Métrica que cuantifica la desviación entre el gradiente del modelo de explicación y el gradiente del modelo de caja negra. Mide la capacidad de una explicación para capturar correctamente la sensibilidad del modelo a las variaciones de entrada.

📖

términos

Complejidad de la explicación (Explanation Complexity)

Medida de la simplicidad o concisión de una explicación, a menudo evaluada por el número de reglas, características o términos no nulos. Una baja complejidad favorece una mejor comprensión humana.

📖

términos

Puntuación de Robustez (Robustness Score)

Evaluación cuantitativa de la variación de las explicaciones frente a perturbaciones adversas en los datos de entrada. Una puntuación alta significa que las explicaciones resisten bien los ataques y el ruido.

📖

términos

Área bajo la Curva de Fidelidad (AUC-Fidelity)

Métrica agregada que calcula el área bajo la curva de fidelidad en función del tamaño del vecindario o del número de características utilizadas. Permite comparar el rendimiento general de los métodos de explicación.

📖

términos

Brecha de Predicción Local (Local Prediction Gap)

Diferencia absoluta entre la predicción del modelo de caja negra y la del modelo de explicación para una instancia específica. Esta métrica evalúa la precisión de la aproximación local.

📖

términos

Tasa de Compresión (Compression Rate)

Relación entre el número de características en el modelo original y el número de características en la explicación simplificada. Cuantifica el grado de simplificación de la explicación en comparación con el modelo completo.

📖

términos

Coherencia de las Explicaciones (Explanation Coherence)

Medida de la coherencia lógica entre las explicaciones generadas para diferentes instancias de una misma clase o para instancias vecinas. Evalúa la coherencia general del sistema de explicación.

📖

términos

Función de Pérdida de Explicación (Explanation Loss Function)

Función objetivo matemática utilizada para optimizar los parámetros de un modelo de explicación. Generalmente equilibra la fidelidad al modelo original y la complejidad de la explicación.

📖

términos

Sensibilidad al Ruido (Noise Sensitivity)

Métrica que cuantifica la variación de las explicaciones cuando se añaden ruidos aleatorios a los datos de entrada. Una baja sensibilidad al ruido es deseable para explicaciones fiables.

📖

términos

Monotonía de la Explicación (Explanation Monotonicity)

Propiedad que mide si las importancias de las características en la explicación varían de manera consistente con los cambios monótonos de los valores de entrada. Asegura la coherencia direccional de las explicaciones.

📖

términos

Error de Reconstrucción (Reconstruction Error)

Métrica que evalúa la capacidad de una explicación para reconstruir el comportamiento del modelo original, a menudo medida por el error cuadrático medio entre las predicciones. Es crucial para los métodos basados en la destilación de modelo.

📖

términos

Índice de Selectividad (Selectivity Index)

Medida que cuantifica la capacidad de un método de explicación para centrarse en las características más relevantes para una predicción dada. Un índice elevado indica una mejor identificación de las variables clave.

📖

términos

Puntuación de Fidelidad Normalizada (Normalized Fidelity Score)

Métrica de fidelidad escalada entre 0 y 1 para facilitar la comparación entre diferentes modelos y métodos de explicación. Permite una evaluación estandarizada de la calidad de las explicaciones.

📖

términos

Protocolo de Evaluación por Eliminación de Características (Feature Ablation Evaluation Protocol)

Metodología sistemática que evalúa la calidad de una explicación midiendo el impacto en el rendimiento del modelo cuando las características identificadas como importantes son eliminadas o enmascaradas.

📖

términos

Métrica de Completitud (Completeness Metric)

Evaluación cuantitativa que mide si una explicación captura todos los factores relevantes que contribuyeron a una predicción específica. Se opone a las explicaciones parciales o incompletas.

📖

términos

Varianza de la Explicación (Explanation Variance)

Medida estadística de la dispersión de las explicaciones generadas en múltiples ejecuciones para la misma instancia. Una baja varianza es esencial para la reproducibilidad y fiabilidad de las explicaciones.

Glosario IA

Estabilidad (Stability)

Infidelidad (Infidelity)

Complejidad de la explicación (Explanation Complexity)

Puntuación de Robustez (Robustness Score)

Área bajo la Curva de Fidelidad (AUC-Fidelity)

Brecha de Predicción Local (Local Prediction Gap)

Tasa de Compresión (Compression Rate)

Coherencia de las Explicaciones (Explanation Coherence)

Función de Pérdida de Explicación (Explanation Loss Function)

Sensibilidad al Ruido (Noise Sensitivity)

Monotonía de la Explicación (Explanation Monotonicity)

Error de Reconstrucción (Reconstruction Error)

Índice de Selectividad (Selectivity Index)

Puntuación de Fidelidad Normalizada (Normalized Fidelity Score)

Protocolo de Evaluación por Eliminación de Características (Feature Ablation Evaluation Protocol)

Métrica de Completitud (Completeness Metric)

Varianza de la Explicación (Explanation Variance)

No se encontraron resultados