一、生生態系統

 一、生態系統   這一切,都起源自Web數據爆炸時代的來臨 數據抓取系統 - Nutch 海量數據怎麼存,當然是用分佈式文件系統 - HDFS 數據怎麼用呢,分析,處理 MapReduce框架,讓你編寫代碼來實現對大數據的分析工作 非結構化數據(日誌)收集處理 - fuse,webdav, chukwa, flume, Scribe 數據導入到HDFS中,至此RDBSM也可以加入HDFS的狂歡了
相關文章
相關標籤/搜索