爬取百度搜索子網頁的(文字、url、時間),爬取不了的截圖——2

嘗試了百度進行某關鍵詞搜索(比如「和平精英」),並搜索前30頁。發現百度搜索的優點和不足。優點:1、搜索面廣,涉及不同的網頁,如圖中的知乎、搜狐、騰訊網、網易號、貼吧等等。2、能夠讓自己對不瞭解的東西有個較爲全面的認識。缺點:存在很多重複的內容,爬取了30頁共300條子網址,我發現有用的子網頁就70條左右。(當然,不包括視頻網址和文本網址,我是僅以截圖內容進行判斷) 通過excel處理後的相關數據
相關文章
相關標籤/搜索