Glosario IA
El diccionario completo de la Inteligencia Artificial
Orquestación de Pipelines ML
Coordinación y automatización de secuencias de pasos interconectados en un workflow de machine learning, desde la ingesta de datos hasta el despliegue del modelo, asegurando la ejecución, el monitoreo y la gestión de dependencias.
Grafo Acíclico Dirigido (DAG)
Estructura de grafo dirigido sin ciclos utilizada para representar las dependencias entre las tareas de un pipeline, donde cada nodo es una tarea y las aristas definen el orden de ejecución, garantizando la ausencia de bucles infinitos.
Gestor de Workflow
Sistema o herramienta de software responsable de la planificación, ejecución, monitoreo y recuperación ante errores de workflows complejos, a menudo basado en DAGs para orquestar tareas distribuidas.
Programación de Tareas
Mecanismo que determina cuándo y cómo las tareas individuales de un pipeline se ejecutan en función de sus dependencias, la disponibilidad de recursos y disparadores predefinidos (tiempo, eventos).
Gestión de Dependencias del Pipeline
Gestión explícita de las relaciones de precedencia entre las etapas de un pipeline, asegurando que una tarea solo se ejecute una vez que todas sus tareas padre han sido completadas exitosamente.
Idempotencia
Propiedad de una tarea u operación de pipeline que garantiza que su ejecución múltiple con las mismas entradas produce el mismo estado final, esencial para la recuperación ante errores y la fiabilidad.
Caché del Pipeline
Técnica que consiste en almacenar los resultados de salida de tareas o etapas intermedias de un pipeline para evitar su reejecución innecesaria durante lanzamientos posteriores, acelerando así las iteraciones.
Parametrización del Pipeline
Práctica de diseñar pipelines con variables externas configurables, permitiendo lanzar ejecuciones con diferentes hiperparámetros, conjuntos de datos o configuraciones sin modificar el código del pipeline.
Versionamiento de Pipeline
Seguimiento y gestión de las diferentes iteraciones y configuraciones de un pipeline a lo largo del tiempo, a menudo a través de un sistema de control de versiones, para asegurar la reproductibilidad y trazabilidad de los experimentos.
Aprovisionamiento de Recursos
Asignación dinámica de los recursos de computación (CPU, GPU, memoria) necesarios para la ejecución de cada tarea del pipeline, optimizando el uso y el costo de la infraestructura.
Encadenamiento de Pipeline
Técnica de orquestación avanzada donde la salida de un pipeline completo sirve de entrada a otro pipeline, permitiendo componer flujos de trabajo de extremo a extremo aún más complejos y modulares.
Ejecución Condicional
Lógica de orquestación que activa o desactiva la ejecución de ciertas ramas o tareas de un pipeline según el resultado de pasos anteriores o condiciones externas.
Monitoreo de Pipeline
Vigilancia continua del estado de avance, rendimiento y errores de los pipelines en ejecución, mediante tableros, alertas y registros para garantizar su correcto funcionamiento.
Flujo de Trabajo como Código
Paradigma donde las definiciones de pipelines y sus lógicas de orquestación se declaran y gestionan como código fuente (ej: en Python o YAML), fomentando la infraestructura como código y la colaboración.
Reejecución de Pipeline
Capacidad de un orquestador para relanzar selectivamente una parte o la totalidad de un pipeline, ya sea para corregir un error, probar un cambio o actualizar datos.
Monitoreo de Acuerdo de Nivel de Servicio (SLA)
Seguimiento del rendimiento de un pipeline en comparación con objetivos predefinidos (ej: tiempo de ejecución máximo, tasa de éxito), con alertas en caso de incumplimiento para garantizar la calidad de servicio.