Hadoop入門知識點

一、什麼是Hadoop 是一個由Apache基金會所開發的分佈式系統基礎架構。 主要解決海量數據的存儲和海量數據的分析計算問題。 廣義上來說,Hadoop通常是指一個更廣泛的概念——Hadoop生態圈。 二、Hadoop發展歷史 Hadoop最早起源於Nutch。Nutch的設計目標是構建一個大型的全網搜索引擎,包括網頁抓取、索引、查詢等功能,但隨着抓取網頁數量的增加,遇到了嚴重的可擴展性問題——
相關文章
相關標籤/搜索