SparkSQL2.0擴展外部數據源原理(讀取HDFS文件)

SparkSQL專門爲讀取HDFS上的文件開的外部數據源接口,spark-parquet、csv、json等都是這種方式。git DefaultSource 入口類,用來創建外部數據源鏈接,SparkSQL默認會找這個名字,不要改類名。基本全部接口都在這個類裏github private[tsfile] class DefaultSource extends FileFormat with Dat
相關文章
相關標籤/搜索