利用Hadoop平臺的map-reduce進行詞頻統計

下述內容操作平臺有三個: 個人PC,遠端阿里雲linux服務器,遠端Hadoop集羣 (一)進入本地服務器實驗文件目錄 (二)查看實驗步驟說明文檔 (三)刪除前一次操作同樣實驗的數據,避免實驗干擾錯誤 (四)上傳數據集到hadoop集羣 (五)不要直接寫完程序去hadoop集羣上運行;先小規模數據,本地模擬程序debug map操作程序 reduce操作程序 (六)利用hadoop streami
相關文章
相關標籤/搜索