前幾天收到一條私信是有關大衆點評的字體反爬的問題,經過分析來此跟大家分享一下解決這個反爬的方法。
1.我們隨便打開大衆點評一個商家的網頁,如下圖
2.右鍵點開網頁源代碼可以發現我們要爬的內容有一部分亂碼了
3.我們點開源代碼上面中的text的css網址
4從打開的css網址裏複製woff文件的地址,並下載下來
5.把下載下來的woff文件到這個鏈接字體轉換格式這個鏈接下將woff文件轉換成otf或者ttf文件
6.最後將轉換好的otf和ttf文件在這個鏈接下打開百度字體查看。
7.可以看到已經識別出來啦。
本文只是提供字體反編譯的一個解析,爬蟲的源碼就靠大家自己的努力了~!