saprkSQL的思考及開發實戰(一)

sparkSQL:數據讀入到sparkSQL,進行數處理或者算法實現,然後再把處理收的數據輸出到相應的輸出源中,在實際開發過程中需要考慮如下幾個點: 1、數據源多少,sparkSql支持多種數據源hive\json\.txt\orc文件\jdbc; 2、字段的映射關係與語言的定義類型相關 3、數據擁有的情況下,組織這些數據->數據結構->操作數據 sparkSQL的實戰介紹 2、hiveConte
相關文章
相關標籤/搜索