Multi-Head Attention
Proyección Lineal
Transformación lineal aplicada a los embeddings de entrada para generar los espacios Query, Key y Value en cada cabeza de atención multicabezal.
← VolverTransformación lineal aplicada a los embeddings de entrada para generar los espacios Query, Key y Value en cada cabeza de atención multicabezal.
← Volver