![](http://static.javashuo.com/static/loading.gif)
前段時間一直在研究微信公衆號爬蟲,終於獲得一個穩定爬取的辦法,目前已穩定運行一月有餘,爬取結果保存的 csv 文件結構以下web
支持爬取任意公衆號的全部文章,包括連接、標題、導語、正文及原圖的 URL 連接、閱讀量、點贊數,支持斷點下載(須要在配置文件中配置),惟一缺點可能就是爲了反反爬在程序中加入了限速的代碼致使效率不是很是高,爬取速度在 120篇/10分鐘左右。微信
爲此,特地寫了一份配置教程,工具
我已經將打包成脫離 Python 環境的工具,並且不須要手機輔助;工具加入了密鑰,只有通過我得到的該工具纔會保證密鑰的有效性,才能保證工具的順利運行,由於我會按期更新密鑰。
flex
很是歡迎有興趣的同窗前來交流相關技術,只要有空,義務解答。編碼
若是有對商業版感興趣的話,能夠小窗私聊我,由於是本人辛勤勞動的成功,但願您能理解,感謝您的配合。
spa
本文分享自微信公衆號 - 月小水長(inspurer)。
若有侵權,請聯繫 support@oschina.cn 刪除。
本文參與「OSC源創計劃」,歡迎正在閱讀的你也加入,一塊兒分享。.net