Alinhamento e Segurança
Dados de Preferência Humana
Conjunto de dados coletado a partir de avaliações humanas comparativas entre diferentes respostas de modelo, servindo como base para o treinamento de alinhamento e otimização.
← Voltar