離線數據清洗,Spark和Python Pandas對比

導語 最近新學習了Spark中RDD的核心用法,爲了鞏固學習成果,因而使用Spark寫了一個數據清洗的代碼,正好以前使用過python中pandas對一樣的數據作數據清洗,因而就把兩種方式的代碼都貼出來,作一個簡單的對比python 數據展現 豆瓣圖書標籤: 小說,[日] 東野圭吾 / 李盈春 / 南海出版公司 / 2014-5 / 39.50元,解憂雜貨店,8.6,(297210人評價) 豆瓣圖
相關文章
相關標籤/搜索