大數據相關業務

搜索引擎 Google三駕馬車GFS,MapReduce,Bigtable初衷就是用於搜索領域。 1.搜索引擎涉及以下3部分: 1).爬蟲——數據收集中心,一個互聯網世界的縮影 2).索引系統——分析整理爬蟲收集到的資源,爲檢索系統提供數據 3).檢索系統——從預處理好的資源裏挑選出用戶最滿意的結果最快最好的展現 2.架構圖: 3.基於MapReduce的建庫系統(建庫流) • 目的:建立供檢索使
相關文章
相關標籤/搜索