決戰大數據之巔:Spark、Dask、Vaex、Pandas的正面交鋒

全文共3924字,預計學習時長15分鐘 圖源:unsplash   新的數據科學問題席捲而來時,首要問題是使用何種技術。廣告宣傳、標準工具、尖端技術、整個平臺和現成的解決方案,都是備選項。 過去的幾年裏,筆者嘗試使用各項技術來構建概念證明和解決方案。筆者註冊試用新平臺、試用任何大型雲平臺發佈的新功能。當一項新技術出現時,筆者必然會瀏覽一些教程並在個人數據集上試用。 筆者決定比較各項數據整理技術,以
相關文章
相關標籤/搜索