Auto-Atenção
Softmax Normalization
Função de ativação que transforma os escores de atenção em distribuição de probabilidades, garantindo que a soma dos pesos de atenção seja igual a 1 para cada posição.
← Voltar