Variantes de Mecanismos de Atención
Atención Kernel
Enfoque que reemplaza el softmax por funciones kernel positivas para obtener complejidad lineal. Permite aproximaciones eficientes mientras preserva las propiedades matemáticas de la atención.
← Volver