Glossário IA
O dicionário completo da Inteligência Artificial
Redes Neurais Binárias
Redes neurais cujos pesos e ativações são restritos a valores binários (+1/-1), oferecendo compressão extrema e ganhos significativos na velocidade de inferência.
Poda Estruturada
Técnica de poda que remove estruturas inteiras como filtros, canais ou camadas completas, permitindo ganhos materiais reais, ao contrário da poda não estruturada.
Computação Dinâmica
Estratégia que adapta a complexidade computacional do modelo com base na entrada ou nas restrições de recursos, otimizando o uso de energia e a latência nos dispositivos edge.
Otimização TensorRT
Conjunto de otimizações NVIDIA incluindo fusão de camadas, calibração de precisão e autoajuste para maximizar o desempenho de inferência em GPUs edge.
TinyML
Área do machine learning visando o deployment de modelos de IA ultra-compactos (<1MB) em microcontroladores com recursos extremamente limitados (RAM <256KB).
ONNX Runtime
Motor de inferência multiplataforma que otimiza a execução de modelos no formato ONNX em diversas arquiteturas de hardware, incluindo dispositivos edge e IoT.
Quantização Pós-treinamento
Técnica de quantização aplicada após o treinamento completo do modelo, usando um pequeno conjunto de calibração para determinar os parâmetros de quantização ótimos.
Redes Neurais Esparsas
Redes neurais contendo uma grande proporção de pesos nulos ou quase nulos, permitindo otimizações computacionais e de armazenamento significativas em plataformas edge.
Fusão de Camadas
Otimização que combina múltiplas camadas sucessivas em uma única operação computacional, reduzindo a sobrecarga de memória e melhorando o paralelismo em aceleradores edge.