Glosario IA
El diccionario completo de la Inteligencia Artificial
Estabilidad de las explicaciones
Propiedad que mide la coherencia de las explicaciones generadas por un modelo cuando las entradas sufren ligeras variaciones, garantizando la fiabilidad de las interpretaciones ante el ruido.
Sensibilidad a las perturbaciones
Capacidad de un método explicativo para mantener resultados coherentes cuando los datos de entrada son modificados por perturbaciones aleatorias o estructuradas.
Ataques adversariales sobre las explicaciones
Técnicas maliciosas diseñadas para manipular o degradar la calidad de las explicaciones sin necesariamente afectar el rendimiento predictivo del modelo subyacente.
Coherencia de las explicaciones
Medida cualitativa que evalúa si las explicaciones generadas son lógicamente compatibles entre sí y con los conocimientos del dominio, asegurando una interpretación coherente.
Fidelidad de las explicaciones
Grado de precisión con el cual una explicación aproxima el comportamiento real del modelo local o globalmente, cuantificando la confianza en la interpretación proporcionada.
Robustez de los modelos explicativos
Capacidad intrínseca de los sistemas explicativos para resistir las variaciones de los datos de entrada y los intentos de manipulación manteniendo interpretaciones válidas y fiables.
Varianza de las explicaciones
Medida estadística que cuantifica la dispersión de las explicaciones generadas para entradas similares, indicando la estabilidad y previsibilidad del sistema explicativo.
Continuidad de las explicaciones
Propiedad que garantiza que pequeñas modificaciones en el espacio de entrada provocan cambios proporcionales y progresivos en las explicaciones producidas.
Invariance des explications
Caractéristique d'une méthode explicative à produire des résultats constants face à des transformations préservant la sémantique, comme les rotations ou les changements d'échelle.
Validation croisée des explications
Méthodologie systématique pour évaluer la cohérence et la robustesse des explications à travers différents sous-ensembles de données et configurations de modèle.
Évaluation de la robustesse explicative
Ensemble de métriques et protocoles standardisés pour quantifier systématiquement la résistance des explications aux perturbations et aux attaques adversariales.
Perturbations sémantiques
Modifications intentionnelles des données d'entrée qui préservent le sens global mais altèrent les caractéristiques superficielles, utilisées pour tester la robustesse des explications.
Attaques par transfert explicatif
Stratégies adversariales exploitant la similarité entre différents modèles ou architectures pour compromettre simultanément leurs systèmes explicatifs respectifs.
Calibration des explications
Processus d'ajustement systématique des scores ou poids explicatifs pour garantir une correspondance fiable entre l'importance perçue et l'impact réel sur les prédictions.
Consistance temporelle des explications
Propriété mesurant la stabilité des explications sur des données temporelles ou séquentielles, assurant une interprétation cohérente à travers différentes fenêtres temporelles.
Agrégation d'explications multiples
Technique combinant plusieurs explications individuelles pour produire une interprétation plus robuste et stable, réduisant l'impact des variations aléatoires ou biaisées.
Sensibilidad a los hiperparámetros
Medida de la dependencia de las explicaciones generadas respecto a las elecciones de hiperparámetros, evaluando la robustez del sistema explicativo frente a su propia configuración.
Isotropía de las explicaciones
Propiedad que garantiza que las explicaciones presenten una distribución uniforme y sin sesgos en el espacio de características, evitando las distorsiones direccionales sistemáticas.
Descomposición de la incertidumbre explicativa
Método analítico que separa las fuentes de incertidumbre en las explicaciones (epistémica, aleatoria, modelo) para cuantificar y mejorar la fiabilidad interpretativa.