Avaliação e Métricas
Toxicidade
Métrica que avalia a probabilidade de um modelo gerar conteúdo ofensivo, odioso, discriminatório ou prejudicial. Geralmente é medida por classificadores especializados treinados em corpora de textos anotados por sua toxicidade.
← Voltar