搜索引擎技術總結2-google原理總結

 google原理:crawler從urlserver得到域名列表,將搜索到的網頁送入storeserver,壓縮網頁存入repository,並從網頁中解析出一個新的url時則分配給此網頁一docID.indexer讀取repository,解壓並解析文檔,每一文檔轉換成一組具體值爲hits的一組詞。hits記錄了該單詞及在文檔中的位置,字體大小等。indexer把這些hits分配到一組barr
相關文章
相關標籤/搜索