Glossário IA
O dicionário completo da Inteligência Artificial
Quantificação Extrema
Técnica de redução de precisão que leva os parâmetros do modelo a 1-2 bits para máxima compressão, sacrificando parcialmente a precisão em favor da eficiência.
Quantificação Binária
Método de quantificação onde cada peso e ativação é representado por um único bit (-1 ou +1), reduzindo drasticamente a memória e acelerando os cálculos.
Quantificação Ternária
Técnica que utiliza três valores tipicamente (-1, 0, +1) para representar os pesos, oferecendo um melhor compromisso entre compressão e desempenho do que a binarização pura.
Quantificação de 1-bit
Forma extrema de quantificação onde cada parâmetro do modelo é armazenado em um único bit, permitindo uma redução de 32x em comparação com modelos padrão de 32 bits.
Quantificação de 2-bits
Representação de pesos e ativações em dois bits, permitindo quatro níveis de quantificação (-3, -1, +1, +3) com um melhor equilíbrio precisão/eficiência.
Binarização de Pesos
Processo de conversão dos pesos de uma rede neural em valores binários, mantendo as ativações com maior precisão para preservar o desempenho.
Quantificação Pós-Treinamento Extrema
Técnica aplicada após o treinamento para reduzir a precisão dos parâmetros para 1-2 bits sem a necessidade de um retreinamento completo do modelo.
Quantificação Ciente da Quantificação Extrema
Método avançado que leva em consideração o impacto da quantificação extrema durante o processo de calibração para minimizar a degradação do desempenho.
Quantização com Aprendizagem Extrema
Abordagem onde o modelo é ajustado especificamente para se adaptar às restrições da quantização extrema, preservando melhor a precisão final.
Rede Neural Binária
Arquitetura onde pesos e ativações são totalmente binarizados, utilizando operações XNOR e popcount para cálculos ultra-otimizados.
Rede Neural Ternária
Variante das redes binárias que utiliza três estados, permitindo maior expressividade enquanto mantém forte compressão e eficiência computacional.
Quantização Assimétrica Extrema
Método de quantização de 1-2 bits que utiliza faixas de valores assimétricas para melhor se adaptar às distribuições não centradas dos pesos.
Quantização Simétrica Extrema
Abordagem de quantização onde a faixa de valores é centrada em zero, simplificando os cálculos mas potencialmente menos eficaz para certas distribuições.
Compressão de Modelo por Quantização Extrema
Técnica global que combina quantização extrema com outros métodos de compressão para atingir taxas de compressão superiores a 100x.
Otimização da Precisão Mínima
Processo que visa determinar a precisão mínima em bits necessária para cada camada do modelo, mantendo um nível de desempenho aceitável.
Calibração para Quantização Extrema
Fase crítica onde os parâmetros de quantização são otimizados usando um pequeno conjunto de dados para minimizar o impacto da redução extrema de precisão.
Quantificação Adaptativa Extrema
Técnica que ajusta dinamicamente o nível de quantificação (1 ou 2 bits) por camada ou por neurônio com base na sua sensibilidade à redução de precisão.
Estabilidade da Quantificação Extrema
Propriedade que mede a robustez de um modelo face à quantificação extrema, essencial para garantir um desempenho fiável em implantação.