看到Twitter上有好多定時更新笑話集錦的賬號,以爲本身也能夠試試,就申請了 @xiaolintemple 這個號,利用爬蟲定時更新笑話python
目前主要笑話來源於 百思不得姐 以及 糗事百科,後期還能夠繼續擴展git
Mongodb : Nosql數據庫github
requests : 一個封裝了HTTP服務的python庫sql
pyquery : 相似Jquery,使用很是方便mongodb
schedule : job scheduling Python庫數據庫
pymongo : Mongodb的python庫網站
twython : 封裝的twitter庫spa
這裏會用到適配器,通配各類網站的爬蟲代碼,方便擴展更多網站rem
主要目的有兩個:get
我的總結。之前碼完代碼以後,也不會總結,也許過段時間再回過頭來再看代碼,總會以爲遺漏掉了一些什麼,當初怎麼想,爲何這麼寫之類的,也想利用這個機會好好總結一下。
此次寫的比較細,若是能給剛開始寫爬蟲的朋友一些借鑑的話,那也算是快事一件。也歡迎你們pull request,一塊兒交流
Github地址: https://github.com/bonfy/xiaolinBot
歡迎你們一塊兒交流