বিহেভিওরাল ক্লোনিং
Erreur de Prédiction
Mesure quantifiant la différence entre les actions prédites par l'agent et les actions de l'expert dans les mêmes états, souvent calculée via l'erreur quadratique moyenne ou la divergence KL. Minimiser cette erreur est l'objectif principal du clonage comportemental.
← ফিরে যান