字體反爬詳解

目前網頁的字體多樣化完全可以自定義,常見有eot,woff,ttf格式類型 本次爬蟲就針對以woff格式的字體而言: 先看看不做措施造成的影響: http://maoyan.com/ 以貓*票房信息爲例 調試模式下票房數字是亂碼的,在源代碼中則是「&#xxxxx」的一竄字符     故,不做措施直接爬取的數據是亂碼的,就是調試模式中看的內容   怎麼做   在源碼中我們可以看到有woff的蹤跡 這
相關文章
相關標籤/搜索