Glossário IA
O dicionário completo da Inteligência Artificial
Quantificação Estruturalmente Restrita
Técnica de compressão neural que aplica restrições de quantificação específicas enquanto preserva a arquitetura e as relações estruturais da rede neural.
Treinamento Ciente de Quantificação (QAT)
Método de treinamento que simula os efeitos da quantificação durante o processo de aprendizado para minimizar a perda de precisão pós-quantificação.
Quantificação Pós-Treinamento (PTQ)
Processo de quantificação aplicado após o treinamento completo do modelo sem a necessidade de retreinamento adicional.
Granularidade de Quantificação
Nível de detalhe no qual os parâmetros são agrupados para a quantificação, variando do nível de tensor ao nível de canal ou grupo.
Viés de Quantificação
Erro sistemático introduzido durante a conversão de números de ponto flutuante para representação de baixa precisão.
Calibração de Quantificação
Processo de determinação dos parâmetros de quantificação ótimos (escala e ponto zero) analisando a distribuição das ativações.
Agrupamento de Pesos
Técnica que agrupa pesos semelhantes em clusters que compartilham um valor representativo comum para reduzir a complexidade.
Precisão Quantificada
Número de bits usados para representar cada valor quantificado, tipicamente 8, 4, 2 ou 1 bit em métodos extremos.
Faixa Dinâmica
Intervalo de valores que o formato quantizado pode representar, crucial para preservar informações importantes do modelo.
Quantização de Baixa Precisão
Compressão extrema usando menos de 8 bits por parâmetro, exigindo técnicas avançadas para manter o desempenho.
Reconstrução de Pesos
Processo de otimização que visa minimizar o erro entre os pesos originais e suas versões quantizadas reconstruídas.
Otimização da Estrutura de Quantização
Algoritmos que determinam automaticamente a configuração de quantização ideal para cada parte da rede.
Sensibilidade à Quantização
Medida do impacto da quantização no desempenho de uma camada específica, guiando as estratégias de quantização heterogênea.
Quantização com Restrições de Topologia
Abordagem que preserva as propriedades topológicas da rede enquanto aplica restrições de quantização específicas.