Hadoop spark sql項目實踐

最近分佈式計算結課做了一個小的實驗報告,分享一下。 操作系統:ubuntu64 Hadoop 實驗過程 1. 準備數據集,我的數據集是網上下載的相機記錄一些地方交通違規次數數據集。(cameras.csv) 部分數據截圖: 把本地文件系統中的cameras.csv上傳到分佈式文件系統HDFS中(放到hadoop用戶目錄下): 3.1 導包: 3.2 初始化sparksession 3.3 製作表頭
相關文章
相關標籤/搜索