Spark---DataDrame學習(一)

一.結構化API–DataFrame Spark結構化API是處理各種數據類型的工具,能處理非結構化的日誌文件、半結構化的csv文件、高度結構化的Parquet文件。包括以下三種核心分佈式集合類型API: Dataset DataFrame SQL表和視圖 DataFrame DataFrame由記錄(record)組成,record是Row類型。一個record由多列組成,這裏可以類比pytho
相關文章
相關標籤/搜索