file_get_contents僞造user_agent curl設置useragent的方法

時間 2019-11-10

標籤 file contents 僞造 user agent curl 設置 useragent 方法欄目 Linux 简体版

原文原文鏈接

file_get_contents 和 curl 這倆強悍的函數,在遠程抓取時候至關有用處.不過一些網站會根據來訪ip是否攜帶user_agent來判斷是正常的瀏覽器客戶端仍是機器.因此,咱們的任務就是給他們僞造user_agent.web

file_get_contents僞造user_agent 方法以下:
瀏覽器

ini_set('user_agent','Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; .NET CLR 2.0.50727;http://www.9qc.com)');服務器

curl僞造user_agent的方法:
curl

curl_setopt($c, CURLOPT_USERAGENT, 'Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; .NET CLR 2.0.50727;http://www.9qc.com)');
函數

curl的完整函數方法:
網站

PS： (.*?)：後面問號的意思是最少匹配（即懶惰匹配），若是沒有那個問號就會最多匹配（即貪婪匹配）。spa

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。