全面剖析各類大數據的處理框架

前言:說起大數據處理,一切都起源於Google公司的經典論文:《MapReduce:Simplied Data Processing on Large Clusters》。在當時(2000年左右),由於網頁數量急劇增加,Google公司內部平時要編寫很多的程序來處理大量的原始數據:爬蟲爬到的網頁、網頁請求日誌;計算各種類型的派生數據:倒排索引、網頁的各種圖結構等等。這些計算在概念上很容易理解,但由
相關文章
相關標籤/搜索