Otimização de Modelos
Fusão de Operações (Operator Fusion)
Técnica de compilação que combina várias operações elementares do grafo de computação (ex: uma convolução seguida de uma adição de viés e uma ativação) em uma única operação kernel, reduzindo assim a sobrecarga de memória e os acessos à memória para acelerar a execução.
← Voltar