Aprendizaje por Conjunto de Modelos
Varianza del Conjunto
Métrica que cuantifica la dispersión de las predicciones entre los diferentes modelos de un conjunto, sirviendo como proxy directo para la incertidumbre epistémica en los sistemas RL basados en modelos. Más elevada en las regiones poco exploradas del espacio de estados.
← Volver