Glossário IA
O dicionário completo da Inteligência Artificial
Escala e Ponto Zero
Parâmetros fundamentais de quantização onde a escala define o fator de conversão entre ponto flutuante e inteiro, enquanto o ponto zero representa o valor inteiro correspondente ao zero em ponto flutuante.
Representação INT8
Formato de quantização que utiliza inteiros de 8 bits com sinal (-128 a 127) para representar pesos e ativações, oferecendo um compromisso ótimo entre precisão e desempenho computacional na maioria dos hardwares.
Representação INT4
Formato de quantização extrema que utiliza inteiros de 4 bits (-8 a 7), reduzindo significativamente o tamanho do modelo, mas introduzindo uma perda notável de precisão que requer técnicas de compensação especializadas.
Distribuição das Ativações
Análise estatística dos valores de saída das camadas neurais em um conjunto de dados de calibração, crucial para determinar as faixas de quantização ideais e minimizar a perda de informação.
Faixa Dinâmica
Diferença entre os valores mínimos e máximos das ativações ou pesos, determinando a resolução de quantização e influenciando diretamente a precisão do modelo quantizado.
Viés de Quantização
Desvio sistemático introduzido pela conversão para uma representação de precisão reduzida, que pode ser compensado por técnicas de ajuste estatístico durante a calibração.
Tabela de Consulta LUT
Estrutura de dados pré-calculada que armazena as correspondências entre valores quantizados e desquantizados, otimizando as operações de conversão durante a inferência para acelerar os cálculos.
Perda de Precisão
Degradação mensurável do desempenho do modelo devido à redução da precisão numérica, avaliada por métricas como a degradação da acurácia ou o aumento do erro de previsão.
Otimização de Pesos
Processo de ajuste fino dos pesos do modelo após a quantização para compensar os erros introduzidos, utilizando técnicas como correção de viés ou ajuste por lotes.
Calibração Min-Max
Técnica de calibração que utiliza os valores extremos observados no conjunto de dados para definir a faixa de quantização, simples mas sensível a valores atípicos que podem degradar a precisão.
Calibração por Percentil
Método de calibração robusto que utiliza percentis (ex: 99.9%) em vez de valores extremos, evitando a influência de outliers e otimizando o uso da faixa dinâmica.
Quantização por Camada
Abordagem que aplica parâmetros de quantização idênticos a todos os pesos de uma camada, simplificando a implementação mas potencialmente subótima para pesos com distribuições variadas.
Quantização por Canal
Técnica avançada que quantiza independentemente cada canal de saída de uma camada convolucional, preservando melhor a precisão ao custo de uma complexidade de cálculo ligeiramente aumentada.