這個專輯開始從環境的搭建到app數據抓取的整套的實戰流程。
咱們會學到什麼?
老鐵,只有個電腦沒有手機怎麼辦,沒事我想到了用模擬器,說實話模擬器沒有手機爬的效率快,可是模擬器都會了手機仍是問題不?
模擬點擊,模擬輸入等功能
-
python編寫爬蟲app數據
-
基於docker的多app端數據抓取系統
拿到數據能幹什麼?
對比其餘公司的狀態,對公司的運營有指導做用。分析用戶的行爲和消費需求。
精準的定位用戶,對用戶進行分類。
拿到報表數據,做爲指導
經過對手app應用投放的數據,最近在某個城市啓動了那麼新的產品,某個營銷數據和趨勢,能夠了解對手在某個城市的運營情況,從而相對的應對。
對於本身的好處
web端的抓取思路不少,github一堆一堆的。可是app抓取應用數據的技能不多。
-
如何抓取App應用的數據?
-
抓取過哪些應用上的數據?
-
抓包工具如何使用?
App的數據好抓嗎?
既簡單又困難
app裏的數據比web端更容易抓取,反爬能力也沒那麼強。大部分都是http或者https協議,返回的數據類型大多數爲json。直接解析json就能夠了。
-
可能須要適當的反編譯,解析出來加密算法並抓取信息
-
可能加固了,須要脫殼,而後反編譯,分析出加密算法並抓取信息
-
須要破解經過各式各樣的證書,簽名,設備綁定等方法,找到隱藏加密算法
python爬蟲工程師須要的技能點
-
python爬蟲開發經驗
-
java開發經驗
-
android開發經驗
-
app 逆向
-
app 脫殼
-
破解加密算法
最終目的
python自動化應用,抓包工具,解析app應用的方法來進行數據的抓取。不須要破解加密算法。
PS:以前也學過一段時間python,爬過一些數據和app,公司目前還停留在手動點擊的測試裏,同事也催我幫忙寫套教程,最好是圍繞docker的完成python的自動化測試,使用app測試工具appium。就開始行動了。裏面但是有不少的灰色技術,潮流技術,多工具對比,哈哈。但願老鐵能夠get到!