Hadoop基礎理論及win7安裝Hadoop

1、數據類型 結構化數據:關係數據。 半結構化數據:XML數據。 非結構化數據:Word, PDF, 文本,媒體日誌 2、 大數據的挑戰 採集數據 策展 存儲 搜索 分享 傳輸 分析 展示 3、Hadoop 架構 加工/計算層(MapReduce):一種並行編程模型,用於編寫普通硬件的設計,谷歌對大量數據的高效處理(多TB數據集)的分佈式應用在大型集羣(數千個節點)以及可靠的容錯方式。 MapRe
相關文章
相關標籤/搜索