Glosario IA
El diccionario completo de la Inteligencia Artificial
Explicación por descomposición modal
Método de interpretabilidad que aísla y cuantifica la contribución individual de cada modalidad de entrada a la predicción final del modelo, permitiendo comprender su influencia relativa.
Gradiente integrado multimodal
Extensión de la técnica de gradientes integrados a los modelos multimodales, que calcula la atribución a lo largo de una ruta de integración en el espacio de características combinadas de todas las modalidades.
Perturbación antagónica multimodal
Enfoque de explicación que evalúa la importancia de las características introduciendo perturbaciones sutiles y coordinadas en una o más modalidades para observar el impacto en la salida del modelo.
Ancla lógica multimodal
Regla de explicación en forma de conjunción de condiciones sobre características de diferentes modalidades (ej: 'SI el texto contiene 'gato' Y la imagen muestra una zona oscura'), que basta para anclar la predicción.
Proyección T-SNE cruzada
Técnica de visualización que proyecta las representaciones de varias modalidades en un espacio 2D común utilizando t-SNE, para observar los alineamientos y las correlaciones entre ellas.
Matriz de co-atribución modal
Representación matricial donde cada elemento (i, j) cuantifica la puntuación de atribución conjunta entre una característica de la modalidad i y una característica de la modalidad j para una predicción dada.
Explicación por contrafactual multimodal
Generación de un ejemplo modificado en una o más modalidades que cambia la predicción del modelo, explicando así la decisión inicial poniendo de manifiesto las condiciones críticas.
Alineamiento de espacios latentes
Proceso de interpretación que busca comprender cómo un modelo proyecta y alinea los espacios de representación de diferentes modalidades en un espacio semántico compartido.
Regularización de ortogonalidad modal
Técnica utilizada durante el entrenamiento para forzar a las representaciones de diferentes modalidades a capturar información complementaria en lugar de redundante, facilitando su interpretación distinta.
Enmascaramiento de importancia modal (Modal Importance Masking)
Método que enmascara secuencialmente partes de cada modalidad de entrada para medir la caída de rendimiento del modelo, creando así un mapa de importancia espacial y temporal para cada tipo de dato.
Canalización de explicación jerárquica multimodal
Enfoque estructurado que genera explicaciones a varios niveles: primero la importancia de cada modalidad, luego la importancia de las características dentro de la modalidad más influyente.
Síntesis de explicaciones textuales a partir de datos visuales
Tarea que consiste en generar una explicación en lenguaje natural que justifique la predicción de un modelo basándose en las regiones u objetos sobresalientes identificados en una imagen de entrada.
Interpretabilidad post-hoc por emulación de modelo unimodal
Método que entrena un modelo simple e interpretable (como un árbol de decisión) para imitar las predicciones del modelo multimodal complejo utilizando las características de una sola modalidad a la vez.