最終我決定經過webbrowser模擬登錄支付寶,獲取數據。根據業務需求,我須要把獲取支付寶的數據作成接口,供業務去調用。難點在於如何能夠穩定的切換帳號,而且保證服務24小時可用。須要處理一系列的異常和超時。缺點是這邊變成單線程,登陸獲取數據只能一個進行完了再進行下一個。還有就是異地登錄會各類驗證,經常使用地登錄徹底沒問題!而後破解ua算法也能夠經過截獲的ua的方式。web
簡單列下登陸流程算法
爬蟲服務 接口線程
1調用獲取驗證碼接口,向隊列中添加一個登陸請求,等待(提示有幾人排隊)blog
2從隊列獲取一個登陸用戶接口
3進入登陸首頁,保存驗證碼圖片,等待用戶輸入帳號密碼 返回圖片驗證碼 隊列
4輸入帳號、密碼和驗證碼,調用登陸接口圖片
5經過輪訓的方式,等待接收用戶的登陸信息,開始登陸支付寶
6驗證是否登陸成功,並判斷是否須要短信驗證 返回須要短信驗證,再次調用登陸接口驗證碼
獲取登陸錯誤(而後進入步驟2) 返回登陸錯誤登錄
7經過輪訓的方式,等待接收短信驗證碼,進行短信驗證
8打開我的資料頁面,獲取我的信息 返回登陸成功
若是我的信息獲取錯誤 返回登陸異常
9獲取其餘信息
10抓取其餘信息 返回其餘信息
11從隊列獲取下一個登陸用戶 ... ...
... ...
後來在登錄以後幾分鐘後會被強制退出和在切換用戶登錄方面還得完善,公司也未採用,就只寫了個demo