Hadoop簡介及安裝

簡介 Hadoop是Apache的頂級項目,是一個可靠的、可擴展的、分佈式計算的開源項目。 創始人:Doug Cutting 和Mike Hadoop起源: 2004年Doug Cutting和Mike Cafarella在設計搜索引擎Nutch的時候 ,利用通用爬蟲爬取了互聯網上的數據,獲取了大概10億個網頁數據 ,因爲互聯網的數據大多數是非結構化的,就意味着這些數據無法存儲到數據庫中。爲了解決
相關文章
相關標籤/搜索