[python爬蟲] Selenium爬取新浪微博內容及用戶信息

在進行天然語言處理、文本分類聚類、推薦系統、輿情分析等研究中,一般須要使用新浪微博的數據做爲語料,這篇文章主要介紹若是使用Python和Selenium爬取自定義新浪微博語料。由於網上完整的語料比較少,而使用Selenium方法有點簡單、速度也比較慢,但方法可行,同時可以輸入驗證碼。但願文章對你有所幫助~ 源碼下載地址:http://download.csdn.net/detail/eastmou
相關文章
相關標籤/搜索