Alinhamento e Segurança
Aprendizado de Preferências
Área do aprendizado de máquina onde os modelos aprendem a partir de comparações entre diferentes opções para capturar as preferências humanas e se alinhar a elas.
← Voltar