Knowledge Distillation
Soft Targets
Probabilités de sortie du teacher model avant l'application de la fonction argmax, contenant des informations sur les relations entre classes que les labels durs ne capturent pas.
← Retour