Glosario IA
El diccionario completo de la Inteligencia Artificial
Versionamiento de Modelos
Sistema de gestión de versiones de modelos de aprendizaje automático que permite seguir las iteraciones, comparar el rendimiento y volver a versiones anteriores en caso de regresión.
Control de Versiones de Datos (DVC)
Herramienta de código abierto que extiende Git para gestionar el versionamiento de conjuntos de datos y modelos voluminosos, almacenando los metadatos en Git y los archivos binarios en almacenamientos en la nube.
Git LFS
Git Large File Storage, extensión de Git que permite versionar archivos grandes como conjuntos de datos y modelos almacenándolos por separado del repositorio Git principal.
Seguimiento de Experimentos
Proceso sistemático de registro de hiperparámetros, métricas, artefactos y resultados de los experimentos de ML para asegurar la trazabilidad y la reproducibilidad.
Registro de Modelos
Sistema centralizado de almacenamiento y gestión de versiones de modelos ML con sus metadatos, estados de despliegue e historial de rendimiento.
Reproducibilidad
Capacidad de recrear exactamente los mismos resultados de un experimento ML utilizando los mismos datos, código, parámetros y entorno de ejecución.
Repositorio de Artefactos
Sistema de almacenamiento versionado para artefactos ML incluyendo modelos entrenados, conjuntos de datos preprocesados y otros archivos binarios con gestión de metadatos.
Detección de Deriva del Modelo
Proceso de monitoreo continuo del rendimiento y distribuciones de datos para identificar la degradación de los modelos debido a cambios en los patrones de datos.
Integración Continua para ML (CI/ML)
Automatización de pruebas de validación de código, datos y modelos en cada commit para garantizar la calidad y coherencia en el pipeline ML.
Entrenamiento Continuo
Automatización del reentrenamiento periódico de modelos con nuevos datos para mantener su relevancia frente a la evolución de los patrones de datos.
Monitoreo de Modelos
Vigilancia continua en producción de predicciones, rendimiento y distribuciones de entrada para detectar anomalías y garantizar el correcto funcionamiento de los modelos.
Procedencia de Datos
Documentación completa del origen, historial y transformaciones de los datos utilizados en los pipelines ML, esencial para la auditoría y cumplimiento.
Versionado Semántico
Convención de numeración (X.Y.Z) para las versiones de modelos donde X indica cambios mayores, Y adiciones de características y Z correcciones menores.
Arquitectura Lakehouse
Arquitectura híbrida que combina la flexibilidad de los data lakes con la gestión estructurada de los data warehouses para optimizar el versionado y análisis de datos ML.
Línea Base del Modelo
Modelo de referencia o versión inicial utilizada como punto de comparación para evaluar mejoras o detectar regresiones en las nuevas versiones.