Alinhamento e Segurança
Red Teaming
Processo sistemático de avaliação das vulnerabilidades dos modelos por especialistas que buscam ativamente provocar comportamentos indesejáveis ou perigosos para identificar e corrigir as fraquezas.
← Voltar