新浪微博爬蟲(一)

最近一個項目須要爬取微博用戶的發微博數量、轉發量、評論數、點贊數,並對評論作情感分析。這兩天大概作出了一個雛形,在此把爬微博過程當中遇到的問題記錄一下,供本身學習和你們參考。 1、模擬登錄 抓包要耐心; 讀懂新浪帳號密碼加密算法 request的使用web 2、PC 端vs. 移動端 PC端:頁面更復雜,但好像反爬比移動端要寬鬆點兒 移動端:頁面結構簡單,適合新手算法 3、爬取過程當中遇到的坑 編
相關文章
相關標籤/搜索