Python 3網絡爬蟲學習筆記(4)——開始採集

一.遍歷單個域名 像之前一樣,我們還是利用維基百科來進行數據採集的學習 通過對維基百科上python詞條的HTML源代碼的觀察,可以發現頁面有關的鏈接都在標籤名爲a的href屬性之中: 如圖,就是指向消歧義的鏈接。而這樣的鏈接又分爲內鏈和外鏈: 內鏈:同一網站不同內容頁面之間的相互鏈接。內鏈就是網站域名下內容頁面之間的鏈接,內鏈優化的好,網站的結構就會好,也就會有利於網站的優化。 外鏈:從別的網站
相關文章
相關標籤/搜索