Quantificação Estática

📖

termos

Escala e Ponto Zero

Parâmetros fundamentais de quantização onde a escala define o fator de conversão entre ponto flutuante e inteiro, enquanto o ponto zero representa o valor inteiro correspondente ao zero em ponto flutuante.

📖

termos

Representação INT8

Formato de quantização que utiliza inteiros de 8 bits com sinal (-128 a 127) para representar pesos e ativações, oferecendo um compromisso ótimo entre precisão e desempenho computacional na maioria dos hardwares.

📖

termos

Representação INT4

Formato de quantização extrema que utiliza inteiros de 4 bits (-8 a 7), reduzindo significativamente o tamanho do modelo, mas introduzindo uma perda notável de precisão que requer técnicas de compensação especializadas.

📖

termos

Distribuição das Ativações

Análise estatística dos valores de saída das camadas neurais em um conjunto de dados de calibração, crucial para determinar as faixas de quantização ideais e minimizar a perda de informação.

📖

termos

Faixa Dinâmica

Diferença entre os valores mínimos e máximos das ativações ou pesos, determinando a resolução de quantização e influenciando diretamente a precisão do modelo quantizado.

📖

termos

Viés de Quantização

Desvio sistemático introduzido pela conversão para uma representação de precisão reduzida, que pode ser compensado por técnicas de ajuste estatístico durante a calibração.

📖

termos

Tabela de Consulta LUT

Estrutura de dados pré-calculada que armazena as correspondências entre valores quantizados e desquantizados, otimizando as operações de conversão durante a inferência para acelerar os cálculos.

📖

termos

Perda de Precisão

Degradação mensurável do desempenho do modelo devido à redução da precisão numérica, avaliada por métricas como a degradação da acurácia ou o aumento do erro de previsão.

📖

termos

Otimização de Pesos

Processo de ajuste fino dos pesos do modelo após a quantização para compensar os erros introduzidos, utilizando técnicas como correção de viés ou ajuste por lotes.

📖

termos

Calibração Min-Max

Técnica de calibração que utiliza os valores extremos observados no conjunto de dados para definir a faixa de quantização, simples mas sensível a valores atípicos que podem degradar a precisão.

📖

termos

Calibração por Percentil

Método de calibração robusto que utiliza percentis (ex: 99.9%) em vez de valores extremos, evitando a influência de outliers e otimizando o uso da faixa dinâmica.

📖

termos

Quantização por Camada

Abordagem que aplica parâmetros de quantização idênticos a todos os pesos de uma camada, simplificando a implementação mas potencialmente subótima para pesos com distribuições variadas.

📖

termos

Quantização por Canal

Técnica avançada que quantiza independentemente cada canal de saída de uma camada convolucional, preservando melhor a precisão ao custo de uma complexidade de cálculo ligeiramente aumentada.

Glossário IA

Escala e Ponto Zero

Representação INT8

Representação INT4

Distribuição das Ativações

Faixa Dinâmica

Viés de Quantização

Tabela de Consulta LUT

Perda de Precisão

Otimização de Pesos

Calibração Min-Max

Calibração por Percentil

Quantização por Camada

Quantização por Canal

Nenhum resultado encontrado