Glossário IA
O dicionário completo da Inteligência Artificial
Quantização de Pesos
Redução da precisão apenas dos pesos do modelo, mantendo as ativações em precisão total para um melhor equilíbrio entre desempenho e velocidade.
Quantização de Ativações
Processo de redução da precisão das ativações (saídas das camadas) além dos pesos para uma otimização máxima do modelo.
Quantização de 8 bits
Conversão dos parâmetros do modelo de 32 ou 16 bits para 8 bits, reduzindo a memória em 75% com impacto moderado na precisão.
Quantização de 4 bits
Técnica extrema de redução para 4 bits, permitindo grandes ganhos de memória, mas exigindo algoritmos avançados para manter o desempenho.
Quantização Dinâmica
Quantização aplicada dinamicamente na inferência, adaptando os parâmetros de quantização em tempo real de acordo com os dados de entrada.
Quantização Estática
Pré-cálculo dos parâmetros de quantização em um conjunto de calibração fixo, otimizando a velocidade, mas exigindo dados representativos.