hadoop學習之路hadoop---大數據兩類典型的開發流程

hadoop是一個各種軟件庫組成的框架,每個軟件庫負責Hadoop一部分功能。一開始就學習這些組件的理論知識,是相當乏味的。先以兩個典型的開發流程來描述各個組件的所處的位置以及實現的功能。 大數據離線計算典型流程一: 如圖典型的大數據開發流程:數據採集→數據清洗(存儲)→數據分析→數據展示 數據來源是多樣的,最常見的是服務器日誌,爬蟲爬取數據,js埋點獲取數據,存在關係書庫的數據,不動數據源採用不
相關文章
相關標籤/搜索