爬取實習僧並進行數據可視化

網頁傳送門 實習僧有字體反爬,但是是靜態的字體文件,所以難度不大。 解決實習增的字體反爬的思路:先把網頁中字體文件的base64編碼匹配下來,進行base64解碼,下載下來,用字體可視化工具將所有字體按順序寫在一個列表裏面記錄下來,用TTFont方法處理這個文件得到的font對象,你會發現font對象的camp unicode編碼的16進制就是網頁中字體編碼的後幾位,把這個值前面加上’&#'就ok
相關文章
相關標籤/搜索