Python爬蟲——簡書首頁文章信息

時間 2021-01-20

標籤爬蟲 python 欄目 Python 简体版

原文原文鏈接

運用Python對簡書首要進行簡書首頁的文章信息進行爬取。具體包括：文章標題、文章id、用戶暱稱、用戶id、總瀏覽量、評論數、點贊數、讚賞量。以及文章插圖和用戶頭像的下載。並對以上數據進行excel的存儲，首先進行文件是否存在的判斷，不存在，則創建。再比較pandas包方法存儲和xlwt方法。網頁分析首先對簡書首頁網頁進行分析。在查看網頁源代碼中按下ctrl+F鍵搜索「做人，不要自作多情，生活

>>阅读原文<<