Quantificação Pós-Treinamento
Inferência Apenas com Inteiros
Paradigma de execução onde todas as operações do modelo são realizadas em aritmética inteira, eliminando completamente as conversões de ponto flutuante para máxima performance.
← Voltar