Glosario IA
El diccionario completo de la Inteligencia Artificial
Redes Neuronales Binarias
Redes neuronales cuyos pesos y activaciones están restringidos a valores binarios (+1/-1), ofreciendo una compresión extrema y ganancias significativas en velocidad de inferencia.
Poda Estructurada
Técnica de poda que elimina estructuras completas como filtros, canales o capas enteras, permitiendo ganancias materiales reales a diferencia de la poda no estructurada.
Computación Dinámica
Estrategia que adapta la complejidad computacional del modelo según la entrada o las restricciones de recursos, optimizando el uso energético y la latencia en los dispositivos edge.
Optimización TensorRT
Conjunto de optimizaciones de NVIDIA que incluye la fusión de capas, la calibración de precisión y el auto-ajuste para maximizar el rendimiento de inferencia en GPUs edge.
TinyML
Campo del machine learning que apunta al despliegue de modelos de IA ultra-compactos (<1MB) en microcontroladores con recursos extremadamente limitados (RAM <256KB).
ONNX Runtime
Motor de inferencia multiplataforma que optimiza la ejecución de modelos en formato ONNX en diversas arquitecturas de hardware incluyendo dispositivos edge e IoT.
Cuantización Post-entrenamiento
Técnica de cuantización aplicada después del entrenamiento completo del modelo, utilizando un pequeño conjunto de calibración para determinar los parámetros de cuantización óptimos.
Redes Neuronales Dispersas
Redes neuronales que contienen una gran proporción de pesos nulos o casi nulos, permitiendo optimizaciones computacionales y de almacenamiento significativas en plataformas edge.
Fusión de Capas
Optimización que combina múltiples capas sucesivas en una única operación computacional, reduciendo la sobrecarga de memoria y mejorando el paralelismo en los aceleradores edge.