Optimización de Transformers
Poda Dinámica de Tokens
Técnica adaptativa que elimina selectivamente los tokens menos relevantes durante el forward pass para reducir la complejidad computacional de la atención.
← Volver