1.使用Snoopy或curl傳搜索引擎爬蟲的USERAGENT值。 php
查看搜索引擎爬蟲的USERAGENT值:http://www.cnblogs.com/grimm/p/5068092.html (http://www.geekso.com/spdier-useragent/ )html
2.使用Snoopy或curl傳referer值。 curl
如:$snoopy->referer = 'http://www.google.com'; ide
$header[] = "Referer: http://www.google.com/";oop
3.使用Snoopy或curl代理。 ui
如:$snoopy->proxy_host = "59.108.44.41"; $搜索引擎
snoopy->proxy_port = "3128"; google
4.使用Snoopy或curl防造IP。 url
如:$snoopy->rawheaders['X_FORWARDED_FOR'] = '127.0.0.1'; 代理
$snoopy->rawheaders['CLIENT-IP'] = '127.0.0.1';
5.用php寫一個重起路由器的程序,這樣就會得到新的ip地址。
6.若是發現重起路由器仍是顯示被封,有可能對方封了你路由器的mac地址,如今路由器都有修改MAC的功能,能夠寫程序或手動修改路由器的MAC地址。
例如:
php curl假裝抓取
$ch = curl_init($url); curl_setopt($ch, CURLOPT_HEADER, 0 ); // 過濾HTTP頭 curl_setopt($ch, CURLOPT_TIMEOUT, 40); curl_setopt($ch, CURLOPT_USERAGENT, 'Baiduspider+(+http://www.baidu.com/search/spider.htm)'); $ip = '220.181.7.121'; curl_setopt($ch, CURLOPT_HTTPHEADER, array('X-FORWARDED-FOR:' . $ip, 'CLIENT-IP:' . $ip)); curl_setopt($ch, CURLOPT_REFERER, "http://www.baidu.com/search/spider.html"); curl_setopt($ch,CURLOPT_RETURNTRANSFER, 1);// 顯示輸出結果 $responseText = curl_exec($ch); curl_close($ch)