【spark2】【源碼學習】【分區數】spark讀取 hdfs/可分割/單個 的文件時是如何劃分分區

前言 spark怎麼知道讀取的是本地文件還是hdfs的文件呢? 前面寫過一篇博客【spark2的textFile()是怎麼實例化各個不同的fs(FileSystem)】,主要是指【本地文件系統】和【hadoop文件系統】,我們看到源碼裏最後是根據文件路徑url的scheme來判斷的: file: LocalFileSystem hdfs: DistributeFileSystem 1、從Input
相關文章
相關標籤/搜索