人工智能完整詞典
将复杂模型(教师模型)的知识转移到更简单模型(学生模型)的过程,在保持预测能力的同时提高最终模型的可解释性。
用等效或近似的决策树替换复杂模型的方法,使用最优分裂标准来最大化忠实度,同时确保可解释性。
专门应用PCA、t-SNE或UMAP等方法来可视化和理解高维空间中特征之间的关系,揭示隐藏结构。
一种测试模型内部表示中是否存在人类可理解概念的方法,使用方向向量来量化特定概念的激活。
将模型预测归因于特定输入特征的一系列技术,包括基于梯度、积分和扰动的方法来解释决策。