4.46-47訪問控制4/5

訪問控制4/5

 訪問控制4

根據user_agent限制訪問(能夠拒絕網絡爬蟲爬走網站內容)

好比我想讓誰訪問個人網站,我就告訴他域名,若是不告訴別人域名,就說明我不想讓他知道個人站點,這須要禁止搜索引擎在網絡上爬取站點內容。能夠經過user_agent來限制。html

  1. 編輯虛擬主機文件nginx

    [root[@localhost](https://my.oschina.net/u/570656) ~]# vim /usr/local/nginx/conf/vhost/test.com.conf
  2. 添加以下內容vim

    if ($http_user_agent ~* 'Spider/3.0|baidu|YoudaoBot|Tomato')
     {
     return 403;
     }
  3. 測試並從新加載配置文件 ..-t ...-s reload網絡

  4. 使用curl測試,curl -A 能夠模擬user_agent,發現返回的代碼是403,表示實驗成功。curl

    [root[@localhost](https://my.oschina.net/u/570656) ~]# curl -A "www.baidu.com" -x127.0.0.1:80 test.com -I
     HTTP/1.1 403 Forbidden
     Server: nginx/1.15.3
     Date: Tue, 04 Sep 2018 17:57:37 GMT
     Content-Type: text/html
     Content-Length: 169
     Connection: keep-alive

 訪問控制5 限制uri

什麼是URI?參考 https://baike.baidu.com/item/URI/2901761?fr=aladdinide

  1. 在上面這個網址當中,baike.baidu.com是域名;/item/URI/2901761是uri ;?後面是參數。
  2. 限制request_uri 就是限制uri和參數中包含指定字符的訪問。
if ($request_uri ~ (abc|123))
{
    return 404;
}

curl 的用法

curl有不少使用方法,可參考: http://www.javashuo.com/article/p-usdmlmbu-m.html測試

相關文章
相關標籤/搜索