基於URL特徵的網站結構信息挖掘

基於URL特徵的網站結構信息挖掘html 王曉飛11web (北京郵電大學模式識別實驗室)算法 摘要:本章首先深刻的研究了網站的結構和URL的特徵,而後制定了三元組節點的URL層次樹的構建規則,利用創建的URL層次樹描述網站的層次結構,最後設計了根據URL層次樹對URL進行網頁分類方法。構建URL層次樹,首先要根據網站的首頁創建URL層次樹的根節點,而後利用網絡爬蟲,將URL層次樹添加枝葉,最後對
相關文章
相關標籤/搜索