月薪20k+爬蟲工程師必備技能-字體反爬

現在越來越多的網站爲了反爬蟲已經開始在字體上下功夫了,主要表現爲在瀏覽器上文字顯示正常,但是用爬蟲抓取下來的卻是亂碼。比如58同城、貓眼電影、實習僧等網站。不過一般字體反爬只會針對一些數字而不是全部文字,爲什麼這樣?看下面的細節就知道啦。 字體反爬原理: 網頁開發者自己創造一種字體,因爲在字體中每個文字都有其代號,那麼以後在網頁中不會直接顯示這個文字的最終的效果,而是顯示他的代號,因此即使獲取到了
相關文章
相關標籤/搜索