Apache Spark
RDD (Resilient Distributed Dataset)
Structure de données fondamentale de Spark, immuable et partitionnée, permettant la tolérance aux pannes par reconstruction des données perdues.
← Retour