藥大貼吧用戶數據資料爬取與簡單分析

使用python爬蟲鏈接到藥大貼吧的首頁,而後爬取每一個話題的連接。將連接記錄到一個列表中。打開列表中的連接,讀取第一頁頁的用戶的主頁連接和話題下的帖子頁數。將用戶的主頁鏈接記錄到一個集合中。若是發現有多頁,就記錄每一頁的鏈接,再從這些鏈接中讀取用戶的主頁鏈接記錄到集合中。這樣可爬取首頁下全部用戶的主頁url。 依次從集合中取出URL,打開主頁,記錄用戶名稱,性別,粉絲數,關注者的信息,發帖量等
相關文章
相關標籤/搜索