Http請求首部Accept-Language

今天下午寫爬蟲,目標網站是個西班牙站點,開始的時候沒當回事,結果在爬一個PDF文件的時候,遇到了問題:Chrome中的PDF與程序獲得的PDF內容不一致,見下圖:緩存



因爲本人不認識西班牙語,開始的時候一直覺得因爲程序獲得的文件的字節流有問題而致使解碼錯誤,猜想了不少方面,包括GZIP壓縮、響應格式、文件緩存等,嘗試了一下午,仍是沒有解決。吃過晚飯後,注意到Chrome中的請求首部:Accept-Language,這時才察覺到多是目標網站進行了國際化。在程序中添加這個首部,果真恢復了正常。網站

相關文章
相關標籤/搜索