【每週代碼】攜程+12306爬蟲項目實現

最近一直在作爬蟲相關的工做 爬12306算是爬蟲裏的經典項目了(我以爲基本相似於深度學習裏的手寫字符串識別項目了hhhh) 和普通的爬蟲項目不一樣,由於要用到實際的工做當中,因此整個流程進行了分佈式處理: 大概思路以下:web 獲得車次的全量表,存入數據庫(方便之後更新) 從數據庫中獲得車次,從攜程上爬取對應車次的中間站信息網頁 將原網址和對應轉存網址的連接都統一存在redis裏 將網址內容保存在
相關文章
相關標籤/搜索