Optimisation de Modèles
Fusion d'Opérations (Operator Fusion)
Technique de compilation qui combine plusieurs opérations élémentaires du graphe de calcul (ex: une convolution suivie d'une addition de biais et d'une activation) en une seule opération kernel, réduisant ainsi la surcharge de mémoire et les accès mémoire pour accélérer l'exécution.
← Geri