Python爬蟲——簡書首頁文章信息

運用Python對簡書首要進行簡書首頁的文章信息進行爬取。具體包括:文章標題、文章id、用戶暱稱、用戶id、總瀏覽量、評論數、點贊數、讚賞量。以及文章插圖和用戶頭像的下載。並對以上數據進行excel的存儲,首先進行文件是否存在的判斷,不存在,則創建。再比較pandas包方法存儲和xlwt方法。 網頁分析 首先對簡書首頁網頁進行分析。在查看網頁源代碼中按下ctrl+F鍵搜索「做人,不要自作多情,生活
相關文章
相關標籤/搜索