Quantificação Estruturalmente Restrita

📖

termos

Quantificação Estruturalmente Restrita

Técnica de compressão neural que aplica restrições de quantificação específicas enquanto preserva a arquitetura e as relações estruturais da rede neural.

📖

termos

Treinamento Ciente de Quantificação (QAT)

Método de treinamento que simula os efeitos da quantificação durante o processo de aprendizado para minimizar a perda de precisão pós-quantificação.

📖

termos

Quantificação Pós-Treinamento (PTQ)

Processo de quantificação aplicado após o treinamento completo do modelo sem a necessidade de retreinamento adicional.

📖

termos

Granularidade de Quantificação

Nível de detalhe no qual os parâmetros são agrupados para a quantificação, variando do nível de tensor ao nível de canal ou grupo.

📖

termos

Viés de Quantificação

Erro sistemático introduzido durante a conversão de números de ponto flutuante para representação de baixa precisão.

📖

termos

Calibração de Quantificação

Processo de determinação dos parâmetros de quantificação ótimos (escala e ponto zero) analisando a distribuição das ativações.

📖

termos

Agrupamento de Pesos

Técnica que agrupa pesos semelhantes em clusters que compartilham um valor representativo comum para reduzir a complexidade.

📖

termos

Precisão Quantificada

Número de bits usados para representar cada valor quantificado, tipicamente 8, 4, 2 ou 1 bit em métodos extremos.

📖

termos

Faixa Dinâmica

Intervalo de valores que o formato quantizado pode representar, crucial para preservar informações importantes do modelo.

📖

termos

Quantização de Baixa Precisão

Compressão extrema usando menos de 8 bits por parâmetro, exigindo técnicas avançadas para manter o desempenho.

📖

termos

Reconstrução de Pesos

Processo de otimização que visa minimizar o erro entre os pesos originais e suas versões quantizadas reconstruídas.

📖

termos

Otimização da Estrutura de Quantização

Algoritmos que determinam automaticamente a configuração de quantização ideal para cada parte da rede.

📖

termos

Sensibilidade à Quantização

Medida do impacto da quantização no desempenho de uma camada específica, guiando as estratégias de quantização heterogênea.

📖

termos

Quantização com Restrições de Topologia

Abordagem que preserva as propriedades topológicas da rede enquanto aplica restrições de quantização específicas.

Glossário IA