簡述PageRank

本文主要內容有詞項作弊、PageRank原理以及如何解決複雜Web結構帶來的問題。 詞項作弊 這裏要說一點歷史,早期的搜索引擎(谷歌出現之前)大部分都是利用網絡爬蟲(第一次知道爬蟲有這麼久的歷史)從Web上抓取數據,然後通過倒排索引的方式列出每個頁面所包含的詞項。倒排索引是一種很容易從給定詞項找到它所在的所有網頁的數據結構,簡單理解就是我們一般都是從key出發去查找Value,這裏在添加了一些附加
相關文章
相關標籤/搜索