使用Jupyter Notebook 加速PySpark開發

目前我們系統的整體架構大概是: Spark Standalone Cluster + NFS FileServer. 自然, 這些都是基於Linux系統. Windows在開發PySpark程序的時候, 大部分情況都沒有什麼問題. 但是有兩種情況就比較蛋疼了: 讀取NFS文件 Windows底下, 一旦涉及到NFS的文件路徑, 就歇菜了: 因爲NFS的文件路徑都是比如 /mnt/nfs/xxx 這
相關文章
相關標籤/搜索