Distributed Computing Models
RDD
Resilient Distributed Dataset, structure de données fondamentale de Spark représentant une collection immuable et partitionnée d'objets pouvant être calculée en parallèle avec une tolérance aux pannes automatique.
← Retour