hadoop基礎01

1、大數據概述 大數據是指無法在一定時間內使用傳統的數據庫軟件工具對其內容進行抓取、管理和處理的數據集合。 有5V+1C的特性 2、hadoop背景 google提出的兩個處理抓取網頁數據的解決方案: 1】分佈式文件系統(GFS):處理海量網頁的存儲-----引申出HDFS 2】分佈式技算框架MAPREDUCE:處理海量網頁的索引----引申出MAPREDUCE 最終獨立出HADOOP 3、had
相關文章
相關標籤/搜索