Fermer

Dataset

RDD vs DataFrame vs Dataset / Blogs / Perficient

RDD vs DataFrame vs Dataset / Blogs / Perficient

Dans le contexte d’Apache Spark, RDD, DataFrame et Dataset sont des abstractions différentes permettant de travailler avec des données structurées et semi-structurées. Voici une brève définition de chacun : RDD (ensemble de données distribuées résilientes) : RDD est l’abstraction de base de Spark. Il représente une collection immuable et distribuée d’objets qui […]

Lire