.htaccess中的apache rewrite規則寫法詳解

.htaccess中的apache rewrite寫法:

php

1 RewriteEngine On
2 RewriteCond %{HTTP_HOST} ^(www\.)?xxx\.com$
3 RewriteCond %{REQUEST_URI} !^/blog/
4 RewriteCond %{REQUEST_FILENAME} !-f
5 RewriteCond %{REQUEST_FILENAME} !-d
6 RewriteRule ^(.*)$ /blog/$1
7 # 沒有輸入文件名的默認到到首頁
8 RewriteCond %{HTTP_HOST} ^(www\.)?xxx\.com$
9 RewriteRule ^(/)?$ blog/index.php [L]

下面我開始解說一下上面的意思:

【RewriteEngine On】表示重寫引擎開,關閉off,做用就是方便的開啓或關閉如下的語句,這樣就不須要一條一條的註釋語句了。

【RewriteCond %{HTTP_HOST} ^(www\.)?xxx\.com$】
這 是重寫條件,前面%{HTTP_HOST}表示當前訪問的網址,只是指前綴部分,格式是www.xxx.com不包括「http://」和「 /」,^表示字符串開始,$表示字符串結尾,\.表示轉義的. ,若是不轉義也行,推薦轉義,防止有些服務器不支持,?表示前面括號www\.出現0次或1次,這句規則的意思就是若是訪問的網址是xxx.com或者 www.xxx.com就執行如下的語句,不符合就跳過。

【RewriteCond %{REQUEST_URI} !^/blog/】
也是重寫條件,%{REQUEST_URI}表示訪問的相對地址,就是相對根目錄的地址,就是域名/後面的成分,格式上包括最前面的「/」,!表示非,這句語句表示訪問的地址不以/blog/開頭,只是開頭^,沒有結尾$

【RewriteCond %{REQUEST_FILENAME} !-f】
【RewriteCond %{REQUEST_FILENAME} !-d】
這兩句語句的意思是請求的文件或路徑是不存在的,若是文件或路徑存在將返回已經存在的文件或路徑

【RewriteRule ^(.*)$ /blog/$1】重寫規則,最重要的部分,意思是當上面的RewriteCond條件都知足的時候,將會執行此重寫規則,^(.*)$是一個正則表達的 匹配,匹配的是當前請求的URL,^(.*)$意思是匹配當前URL任意字符,.表示任意單個字符,*表示匹配0次或N次(N>0),後面 /blog/$1是重寫成分,意思是將前面匹配的字符重寫成/blog/$1,這個$1表示反向匹配,引用的是前面第一個圓括號的成分,即^(.*)$中 的.* ,其實這兒將會出現一個問題,後面討論。

【RewriteCond %{HTTP_HOST} ^(www\.)?xxx\.com$】
【RewriteRule ^(/)?$ blog/index.php [L]】
這兩句的意思是指請求的host地址是www.xxx.com是,若是地址的結尾只有0個或者1個「/」時,將會重寫到子目錄下的主頁,我猜測這主要由於重寫後的地址是不能自動尋找主頁的,須要本身指定。

現 在說說出現的問題,RewriteRule ^(.*)$ /blog/$1前部分^(.*)$將會匹配當前請求的url,例如:請求網址是http://www.xxx.com/a.html,究竟是匹配整個 http://www.xxx.com/a.html,仍是隻匹配/a.html即反斜槓後面的成分,仍是隻匹配a.html。
答案是:根據 RewriteBase規則規定,若是rewritebase 爲/,將會匹配a.html,不帶前面的反斜槓,因此上條語句應該寫成RewriteRule ^(.*)$ blog/$1(不帶/),不過實際應用上帶上前面的反斜槓,也能夠用,可能帶不帶都行。如今問題出來了,若是不設置rewritebase 爲/ ,將會匹配整個網址http://www.xxx.com/a.html,顯然這是錯誤的,因此應該添加這條:
RewiteBase /

還有一個問題是,不能保證每一個人輸入的網址都是小寫的,若是輸入大寫的呢,linux系統是區分大小寫的,因此應該在RewriteCond後添加[NC]忽略大小寫的。
至此,完整的語句應該是:

html

01 ####start####
02 RewriteEngine On
03 RewiteBase /
04 RewriteCond %{HTTP_HOST} ^(www\.)?xxx\.com$ [NC]
05 RewriteCond %{REQUEST_URI} !^/blog/
06 RewriteCond %{REQUEST_FILENAME} !-f
07 RewriteCond %{REQUEST_FILENAME} !-d
08 RewriteRule ^(.*)$ blog/$1
09 # 沒有輸入文件名的默認到到首頁
10 RewriteCond %{HTTP_HOST} ^(www\.)?xxx\.com$ [NC]
11 RewriteRule ^(/)?$ blog/index.php [L]
12 ####end####

若是後面還繼續有語句的,就不該該加上最後的[L],由於這是表示最後一條語句的意思

防盜鏈的語句,一樣須要添加RewiteBase /,以下:

linux

1 RewriteEngine on
2 RewiteBase /
3 RewriteCond %{HTTP_REFERER} !^$ [NC]
4 RewriteCond %{HTTP_REFERER} !xxx.info [NC]
5 RewriteRule \.(jpg|gif|png|bmp|swf|jpeg)$ /error/daolian.gif [R,NC,L]

若是後面還繼續有語句的,就不該該加上最後的[L],/error/daolian.gif爲別人盜鏈時顯示的圖片。

下面附上簡單的語法規則和flags:
【RewriteCond語法:】
RewriteCond TestString CondPattern [flags]
rewritecond的其餘用法:
‘-d’(目錄)
將TestString視爲一個路徑名並測試它是否爲一個存在的目錄。
‘-f’(常規文件)
將TestString視爲一個路徑名並測試它是否爲一個存在的常規文件。
‘-s’(非空的常規文件)
將TestString視爲一個路徑名並測試它是否爲一個存在的、尺寸大於0的常規文件。
‘-l’(符號鏈接)
將TestString視爲一個路徑名並測試它是否爲一個存在的符號鏈接。
‘-x’(可執行)
將TestString視爲一個路徑名並測試它是否爲一個存在的、具備可執行權限的文件。該權限由操做系統檢測。
‘-F’(對子請求存在的文件)
檢查TestString是否爲一個有效的文件,並且能夠在服務器當前的訪問控制配置下被訪問。它使用一個內部子請求來作檢查,因爲會下降服務器的性能,因此請謹慎使用!
‘-U’(對子請求存在的URL)
檢查TestString是否爲一個有效的URL,並且能夠在服務器當前的訪問控制配置下被訪問。它使用一個內部子請求來作檢查,因爲會下降服務器的性能,因此請謹慎使用!

【RewriteRule語法:】
RewriteRule Pattern Substitution [flags]

【flags】:

‘chain|C’(連接下一規則)
此 標記使當前規則與下一個規則相連接。它產生這樣的效果:若是一個規則被匹配,則繼續處理其後繼規則,也就是這個標記不起做用;若是該規則不被匹 配,則其後繼規則將被跳過。好比,在一個目錄級規則中執行一個外部重定向時,你可能須要刪除」.www」(此處不該該出現」.www」)。

‘cookie|CO=NAME:VAL:domain[:lifetime[:path]]’(設置cookie)
在客戶端設置一個cookie。cookie的名稱是NAME,值是VAL。domain是該cookie的域,好比’.apache.org’,可選的lifetime是cookie的有效期(分鐘),可選的path是cookie的路徑。

‘env|E=VAR:VAL’(設置環境變量)
此 標記將環境變量VAR的值爲VAL,VAL能夠包含可擴展的正則表達式反向引用($N和%N)。此標記能夠屢次使用以設置多個變量。這些變量可 以在其後許多狀況下被間接引用,一般是在XSSI(<!–#echo var=」VAR」–>)或CGI($ENV{‘VAR’})中,也能夠在後繼的RewriteCond指令的CondPattern參數中經過% {ENV:VAR}引用。使用它能夠記住從URL中剝離的信息。

‘forbidden|F’(強制禁止URL)
強制禁止當前URL,也就是當即反饋一個HTTP響應碼403(被禁止的)。使用這個標記,能夠連接若干個RewriteConds來有條件地阻塞某些URL。

‘gone|G’(強制廢棄URL)
強制當前URL爲已廢棄,也就是當即反饋一個HTTP響應碼410(已廢棄的)。使用這個標記,能夠標明頁面已經被廢棄而不存在了。

‘handler|H=Content-handler’(強制指定內容處理器)
強自制定目標文件的內容處理器爲Content-handler。例如,用來模擬mod_alias模塊的ScriptAlias指令,以強制映射文件夾內的全部文件都由」cgi-script」處理器處理。

‘last|L’(結尾規則)
當即中止重寫操做,並再也不應用其餘重寫規則。它對應於Perl中的last命令或C語言中的break命令。這個標記用於阻止當前已被重寫的URL被後繼規則再次重寫。例如,使用它能夠重寫根路徑的URL(‘/’)爲實際存在的URL(好比:’/e/www/’)。

‘next|N’(從頭再來)
重 新執行重寫操做(從第一個規則從新開始)。此時再次進行處理的URL已經不是原始的URL了,而是經最後一個重寫規則處理過的URL。它對應於 Perl中的next命令或C語言中的continue命令。此標記能夠從新開始重寫操做(當即回到循環的開頭)。可是要當心,不要製造死循環!

‘nocase|NC’(忽略大小寫)
它使Pattern忽略大小寫,也就是在Pattern與當前URL匹配時,’A-Z’和’a-z’沒有區別。

‘noescape|NE’(在輸出中不對URI進行轉義)
此 標記阻止mod_rewrite對重寫結果應用常規的URI轉義規則。 通常狀況下,特殊字符(‘%’, ‘$’, ‘;’等)會被轉義爲等值的十六進制編碼(‘%25′, ‘%24′, ‘%3B’等)。此標記能夠阻止這樣的轉義,以容許百分號等符號出如今輸出中,好比:
RewriteRule /foo/(.*) /bar?arg=P1\%3d$1 [R,NE]
可使’/foo/zed轉向到一個安全的請求’/bar?arg=P1=zed’。

‘nosubreq|NS’(不對內部子請求進行處理)
在 當前請求是一個內部子請求時,此標記強制重寫引擎跳過該重寫規則。好比,在mod_include試圖搜索目錄默認文件(index.xxx) 時,Apache會在內部產生子請求。對於子請求,重寫規則不必定有用,並且若是整個規則集都起做用,它甚至可能會引起錯誤。因此,能夠用這個標記來排除 某些規則。
使用原則:若是你爲URL添加了CGI腳本前綴,以強制它們由CGI腳本處理,但對子請求處理的出錯率(或者資源開銷)很高,在這種狀況下,可使用這個標記。

‘proxy|P’(強制爲代理)
此 標記使替換成分被內部地強制做爲代理請求發送,並當即中斷重寫處理,而後把處理移交給mod_proxy模塊。你必須確保此替換串是一個可以被 mod_proxy處理的有效URI(好比以http://hostname開頭),不然將獲得一個代理模塊返回的錯誤。使用這個標記,能夠把某些遠程成 分映射到本地服務器域名空間,從而加強了ProxyPass指令的功能。
注意:要使用這個功能,必須已經啓用了mod_proxy模塊。

‘passthrough|PT’(移交給下一個處理器)
此 標記強制重寫引擎將內部request_rec結構中的uri字段設置爲filename字段的值,這個小小的修改使得RewriteRule 指令的輸出可以被(從URI轉換到文件名的)Alias, ScriptAlias, Redirect等指令進行後續處理[原文:This flag is just a hack to enable post-processing of the output of RewriteRule directives, using Alias, ScriptAlias, Redirect, and other directives from various URI-to-filename translators.]。舉一個能說明其含義的例子: 若是要將/abc重寫爲/def, 而後再使用mod_alias將/def轉換爲/ghi,能夠這樣:
RewriteRule ^/abc(.*) /def$1 [PT]
Alias /def /ghi
若是省略了PT標記,雖然將uri=/abc/…重寫爲filename=/def/…的部分運做正常,可是後續的mod_alias在試圖將URI轉換到文件名時會遭遇失效。
注意:若是須要混合使用多個將URI轉換到文件名的模塊時,就必須使用這個標記。。此處混合使用mod_alias和mod_rewrite就是個典型的例子。

‘qsappend|QSA’(追加查詢字符串)
此標記強制重寫引擎在已有的替換字符串中追加一個查詢字符串,而不是簡單的替換。若是須要經過重寫規則在請求串中增長信息,就可使用這個標記。

‘redirect|R [=code]‘(強制重定向)
若 Substitution以http://thishost[:thisport]/(使新的URL成爲一個URI)開頭,能夠強制性執行一個 外部重定向。若是沒有指定code,則產生一個HTTP響應碼302(臨時性移動)。若是須要使用在300-400範圍內的其餘響應代碼,只需在此指定即 可(或使用下列符號名稱之一:temp(默認), permanent, seeother)。使用它能夠把規範化的URL反饋給客戶端,如將」/~」重寫爲」/u/」,或始終對/u/user加上斜槓,等等。
注意:在 使用這個標記時,必須確保該替換字段是一個有效的URL。不然,它會指向一個無效的位置!而且要記住,此標記自己只是對URL加上 http://thishost[:thisport]/前綴,重寫操做仍然會繼續進行。一般,你還會但願中止重寫操做而當即重定向,那麼就還須要使 用’L'標記。

’skip|S=num’(跳事後繼規則)
此標記強制重寫引擎跳過當前匹配規則以後的num個規則。它能夠模擬if-then-else結構:最後一個規則是then從句,而被跳過的skip=N個規則是else從句。注意:它和’chain|C’標記是不一樣的!

‘type|T=MIME-type’(強制MIME類型)
強 制目標文件的MIME類型爲MIME-type,能夠用來基於某些特定條件強制設置內容類型。好比,下面的指令可讓.php文件在 以.phps擴展名調用的狀況下由mod_php按照PHP源代碼的MIME類型(application/x-httpd-php-source)顯 示:
RewriteRule ^(.+\.php)s$ $1  [T=application/x-httpd-php-source]正則表達式


 

若是熟練掌握rewrite規則的編寫,可以增強對網站URL的控制,對用戶體驗、SEO都十分有利。apache

 

1、防盜鏈功能安全

1 RewriteEngine On
2 RewriteCond %{HTTP_REFERER} !^http://(.+.)?mysite.com/ [NC]
3 RewriteCond %{HTTP_REFERER} !^$
4 RewriteRule .*.(jpe?g|gif|bmp|png)$ /images/nohotlink.jpg [L]

逐行講解一下:服務器

 

1.打開Rewrite功能。有可能服務器設置裏已是全局下打開了,可是多寫也沒事。cookie

2.RewriteCond指令,定義生效條件,用於尋找匹配條件的地址。後面內容用正則表達式匹配。表明含義是發送的請求不禁mysite.com而來,那就是盜鏈啦。末尾的[NC]表明忽略大小寫。app

3.發送請求的主機前綴不爲空。dom

4.RewriteRule指令,定義重寫規則,把匹配的地址按此規則重寫。本例中把這些後綴爲這些圖片格式的,都替換到某一個圖片下。[L]表示這是最後一段規則。

 

只這四行就實現了防盜鏈是否是很神奇,編寫起來是否是又以爲複雜。

這裏總結了幾個經常使用參數(不是所有):

 

RewriteCond下:

[NC] 不分字母大小寫

[OR] 用於鏈接下一條規則

 

RewriteRule下:

[R] 強制重定向,[R=code] code默認爲302

[F] 禁用URL,返回HTTP 403 錯誤

[L] 這是最後一條規則,以後內容無用

 

還有一篇關於正則表達式的教程(很詳細):

http://www.unibetter.com/deerchao/zhengzhe-biaodashi-jiaocheng-se.htm

 

2、網址規範化

1 Options +FollowSymLinks
2 rewriteEngine on
3 rewriteCond %{http_host} ^yourdomain.com [NC]
4 rewriteRule ^(.*)$ http://www.yourdomain.com/$1 [R=301,L]

這個是把全部二級域名都重定向到www.yourdomain.com的例子,如今看來是否是很簡單了?

須要注意的是,這裏的Options +FollowSymLinks不是必須的,但在某些服務器若是不設置FollowSymLinks,可能引發500錯誤。

 

再來看一個好玩的重定向,把google蜘蛛指向某個網站

1 RewriteEngine On
2 RewriteBase /
3 RewriteCond %{HTTP_USER_AGENT} (Googlebot)
4 RewriteRule ^ http://abc.com/ [R=301,L]

1.打開Rewrite功能。

2.RewriteBase指令,設置目錄級重寫的基準URL。能夠理解成把該目錄(這個.htaccess所在目錄)假定爲基準的URL前綴。本例中這樣的寫法無用。

3.RewriteCond指令。匹配全部USER_AGENT爲Googlebot的發送請求。

4.RewriteRule指令。本例中把這些請求都重定向到了abc.com。

 

在本例中,這個配置應該是黑客所爲,把google蜘蛛指向某個網站,等於僞造PR。

 

3、臨時錯誤頁面

 

當你的網站在升級、修改的時候,你最好讓訪客轉到指定的頁面,而不是沒作完的頁面或者是錯誤頁。

這時咱們作一個302轉跳就好。

1 RewriteEngine on
2 RewriteCond %{REQUEST_URI} !/maintenance.html$
3 RewriteCond %{REMOTE_ADDR} !^123.123.123.123
4 RewriteRule $ /error.html [R=302,L]

1.繼續打開Rewrite功能。

2.REQUEST_URI,請求的URL值。這裏指全部訪問maintenance.html頁面的請求。

3.REMOTE_ADDR,向服務器發送請求的IP地址。本例中此處應設爲你本身的IP,這樣就只有你能訪問。

4.RewriteRule指令。本例中把這些請求都重定向到了error.html 。

 

在本例,咱們總結幾個經常使用的正則表達式和特殊符號。

 

(.*) 用於匹配某一區域內全部內容。如 abc/def/ghi 可用 (.*)/(.*)/(.*) 匹配。

([a-zA-Z_]+) 匹配英文單詞,容許用-和_鏈接。

([0-9]+) 匹配多位數字,一般用於匹配ID。

([0-9]) 只匹配一位的數字。

 

^ 表示正則的開始

$ 表示正則的結束

 

4、重定向RSS地址到Feedburner

 

除了能夠更改模板裏的RSS地址外,.htaccess也能實現RSS地址的更改,並更加方便。

1 RewriteEngine on
2 RewriteCond %{HTTP_USER_AGENT} !FeedBurner    [NC]
3 RewriteCond %{HTTP_USER_AGENT} !FeedValidator [NC]
4 RewriteRule ^feed/?([_0-9a-z-]+)?/?$ http://feeds2.feedburner.com/yourname [R=302,NC,L]

有了上面的總結,本例其實就很簡單了吧。

惟一要注意的是這樣操做要確保填寫正確的HTTP_USER_AGENT。其實你不常換模板的話。。可能仍是直接改模板更省事。

相關文章
相關標籤/搜索