[Hadoop] 實際應用場景之 - 阿里

Hadoop在淘寶和支付寶的應用從09年開始,用於對海量數據的離線處理,例如對日誌的分析,也涉及內容部分,結構化數據等。使用Hadoop主要基於可擴展性的考慮,規模從當初的3-4百節點增長到今天單一集羣3000節點以上,2-3個集羣,支付寶的集羣規模也達700臺,使用Hbase,個人消費記錄,key-value型。 阿里對Hadoop的源碼做了如下修改: 改進Namenode單點問題 增加安全性
相關文章
相關標籤/搜索