創始人:人稱Hadoop之父的Doug Cutting
,Apache軟件基金會主席,是Lucene、Nutch 、Hadoop等項目的發起人。web
最開始Hadoop只是Apache Lucene的子項目Nutch的一部分。Lucene
是全球第一個開源的全文檢索引擎工具包,想必作過Javaweb的搜索功能的同窗都接觸過。
它有完成的查詢引擎和部分文本分析引擎。Nutch
基於Lucene,並具備網頁抓取和解析的功能,能夠實現一個搜索引擎的開發,可是若是投入使用的話就必須在極短期內作出反應,而且可以實現短期內對億級數量的網頁進行分析處理,這就須要考慮分佈式任務處理、故障恢復、負載均衡這些問題。
後來Doug Cutting 借鑑谷歌的Google File System
和MapReduce:Simplified Data Processing On Large Clusters
兩篇論文,移植了其中的技術,並將其命名爲:Hadoop。負載均衡
#Q: Hadoop的圖標爲何是一個大象呢?分佈式