Python爬蟲——字體反爬

字體反爬的原理 網頁開發者自己創造一種字體,因爲在字體中每個文字都有其代號,那麼以後在網頁中不會直接顯示這個文字的最終的效果,而是顯示他的代號,因此即使獲取到了網頁中的文本內容,也只是獲取到文字的代號,而不是文字本身。 因爲創造字體費時費力,並且如果把中國3000多常用漢字都實現,那麼這個字體將達到幾十兆,也會影響網頁的加載。一般情況下爲了反爬蟲,僅會針對0-9以及少數漢字進行自己單獨創建,其他的
相關文章
相關標籤/搜索