Calcul en Mémoire
Spark RDD (Resilient Distributed Datasets)
Abstraction fondamentale d'Apache Spark représentant des collections immuables partitionnées en mémoire, avec traçabilité des transformations pour tolérance aux pannes.
← Retour