Glossário IA

O dicionário completo da Inteligência Artificial

242

categorias

3.306

subcategorias

39.932

termos

Redução da precisão apenas dos pesos do modelo, mantendo as ativações em precisão total para um melhor equilíbrio entre desempenho e velocidade.

Processo de redução da precisão das ativações (saídas das camadas) além dos pesos para uma otimização máxima do modelo.

Conversão dos parâmetros do modelo de 32 ou 16 bits para 8 bits, reduzindo a memória em 75% com impacto moderado na precisão.

Técnica extrema de redução para 4 bits, permitindo grandes ganhos de memória, mas exigindo algoritmos avançados para manter o desempenho.

Quantização aplicada dinamicamente na inferência, adaptando os parâmetros de quantização em tempo real de acordo com os dados de entrada.

Pré-cálculo dos parâmetros de quantização em um conjunto de calibração fixo, otimizando a velocidade, mas exigindo dados representativos.

🔍