Hadoop的簡介及僞分佈式安裝

一、Hadoop簡介 是Apache的頂級項目,是一個可靠的、可擴展的、支持分佈式計算的開源項目。 起源 創始人:Doug Cutting 和Mike 2004 Doug和Mike創建了Nutch - 利用通用爬蟲爬取了互聯網上的所有數據,獲取了10億個網頁數據 - 10億個網頁數據是非結構化數據,就意味着這些數據是無法存儲到數據庫中 Doug發現了Google在2003年發表的一篇論文:《Goo
相關文章
相關標籤/搜索