Abstraction et simplification
Concept Activation Vectors (CAV)
Approche testant si des concepts humains compréhensibles sont présents dans les représentations internes d'un modèle, en utilisant des vecteurs directionnels pour quantifier l'activation de concepts spécifiques.
← Indietro