Mecanismos de Contenção
Classificação de Inocuidade
Tarefa de classificação binária com o objetivo de determinar se uma saída de LLM é 'inofensiva' ou 'nociva', frequentemente implementada como um filtro de segurança.
← Voltar