Aprendizagem Temporal Diferencial
Convergence TD
Propriedade matemática que garante que os algoritmos de aprendizado temporal diferencial convergem para os valores ótimos sob certas condições nas taxas de aprendizado e exploração.
← Voltar