Multi-Head Attention
Projeção Linear
Transformação linear aplicada aos embeddings de entrada para gerar os espaços Query, Key e Value em cada cabeça de atenção multi-cabeças.
← VoltarTransformação linear aplicada aos embeddings de entrada para gerar os espaços Query, Key e Value em cada cabeça de atenção multi-cabeças.
← Voltar