Procesamiento por Lotes
Shuffling
Operación costosa de redistribución de datos entre los nodos del clúster durante las fases de agrupamiento o agregación en los tratamientos distribuidos. El shuffling representa a menudo el principal cuello de botella en los trabajos MapReduce y Spark.
← Volver