大數據入門與實戰-PySpark的使用教程

1 PySpark簡介 Apache Spark是用Scala編程語言編寫的。爲了用Spark支持Python,Apache Spark社區發佈了一個工具PySpark。使用PySpark,您也可以使用Python編程語言處理RDD。正是由於一個名爲Py4j的庫,他們才能實現這一目標。 這裏不介紹PySpark的環境設置,主要介紹一些實例,以便快速上手。 2 PySpark - SparkCont
相關文章
相關標籤/搜索