URL 重寫

1、正則表達式教程

有一個經典的教程: 正則表達式30分鐘入門教程,你們能夠搜索一下。
這個教程的確很簡單,看完基本上寫一些簡單的正則就沒有問題了。正則是一個須要長期使用的工具,隔段時間不用會忘記,因此我每次都看一遍這個教程。其實學過以後重要的就是一點內容。

簡單羅列以下:

.換行符之外的全部字符
\w 匹配字母或數字或下劃線或漢字
\s 匹配任意的空白符
\d 匹配數字
\b 匹配單詞的開始或結束
^ 匹配字符串的開始
$ 匹配字符串的結束
* 重複零次或更屢次
+ 重複一次或更屢次
? 重複零次或一次
{n} 重複n次
{n,}重複n次或更屢次
{n,m} 重複n到m次

應用替換時,前面第一個()中匹配的內容後面就用$1引用,第二個()中匹配的就用$2應用……

分析一下 discuz搜索引擎優化 htaccess 裏面的重寫。

RewriteRule ^forum-([0-9]+)-([0-9]+)\.html$ forumdisplay.php?fid=$1&page=$2

首先加入用戶經過 linuxidc.com/forum-2-3.html 訪問discuz論壇,那麼先經過.htaccess過濾,看看是否須要.htaccess引導一下用戶,若是知足列出的一系列RewriteCond的 條件那麼就進行重寫,

discuz的沒有列出RewriteCond 因此應該所有都進行重寫。因此開始進行轉寫,forum-2-3.html 這個正好符合 列出的^forum-([0-9]+)-([0-9]+)\.html$ 正則表達式。而且 $1 爲 2 ,$2爲3 ,因此代

入後面,即 forumdisplay.php?fid=2&page=3 加上前面的RewriteBase 指定的文件目錄,那麼就帶他到制定目錄的forumdisplay.php?fid=2&page=3 。

2、常見的.htaccess應用舉例(部分例子引自四個例子實戰講解.htaccess文件rewrite規則)

4.1 防止盜鏈,若是來得要訪問jpe jpg bmp png結尾的url 用戶不是來自咱們的網站,那麼讓他看一張咱們網站的展現圖片。
RewriteEngine OnRewriteCond %{HTTP_REFERER} !^http://(.+.)?mysite.com/ [NC]RewriteCond %{HTTP_REFERER} !^$RewriteRule .*.(jpe?g|gif|bmp|png)$ /images/nohotlink.jpg [L]

4.2 網站升級的時候,只有特定IP才能訪問,其餘的用戶將看到一個升級頁面
RewriteEngine onRewriteCond %{REQUEST_URI} !/upgrade.html$RewriteCond %{REMOTE_HOST} !^24\.121\.202\.30

RewriteRule $ http://www.linuxidc.com/upgrade.html [R=302,L]

4.3把老的域名轉向新域名
# redirect from old domain to new domainRewriteEngine OnRewriteRule ^(.*)$http://www.yourdomain.com/$1[R=301,L]

3、經常使用示例

RewriteEngine On
RewriteRule index.html index.php

好比:http://www.3code.cn/index.html  -> http://www.3code.cn/index.php

RewriteRule ^test([0-9]*).html$ test.php?id=$1

好比:http://www.3code.cn/test8.html  -> http://www.3code.cn/test.php?id=8

RewriteRule ^cat-([0-9]+)-([0-9]+)\.html$ cat.php?id1=$1&id2=$2

好比:http://www.3code.cn/cat-1-3.html -> http://www.3code.cn/cat.php?id1=1&id2=3

RewriteRule ^cat-([a-zA-Z0-9\-]*)-([0-9]+)-([0-9]+)\.html$ cat.php?id0=$1&id1=$2&id2=$3

好比:http://www.3code.cn/cat-zbc2ac-3-5.html -> http://www.3code.cn/cat.php?id0=zbc2ac&id1=3&id2=5

RewriteRule ^cat1-([0-9]+)-([0-9]+)-([0-9]+)\.html$ cat1.php?id1=$1&id2=$2&id3=$3

好比:http://www.3code.cn/cat1-4-3-8.html -> http://www.3code.cn/cat1.php?id1=4&id2=3&id3=8

RewriteRule ^cat([0-9]*)/$ cat.php?id1=$1

好比:http://www.3code.cn/cat5/ -> http://www.3code.cn/cat.php?id1=5

RewriteRule ^catm([0-9]*)/([0-9]*)/$ catm.php?id1=$1&id2=$2

好比:http://www.3code.cn/catm6/3/ -> http://www.3code.cn/catm.php?id1=6&id2=3


二、Apache的URL地址重寫
http://hi.baidu.com/sonan/blog/item/c408963d89468208bba16716.html
第一種方法:Apache環境中若是要將URL地址重寫,正則表達式是最基本的要求,但對於通常的URL地址來講,基本的匹配就能實現咱們大部分要求,所以除非 是很是特殊的URL地址,但這不是我要討論的範圍,簡單幾招學會Apache中URL地址重寫,經過實例展現,輕鬆學會URL地址重寫:


URL實例

重寫URL:http://www.baidu.com/?p=152

原始URL:http://www.baidu.com/p152.html

重寫規則:

^p([0-9]+)\.html      /?p=$1     [L]

正則基礎知識:

^ 匹配行的開始,匹配URL地址的開頭部分,對於RewriteRule而言,域名(http://www.biuuu.com)不是URL地址的一部分,如上:?p=152


() 分隔一個被捕獲的表達式,如上:([0-9]+)


[] 定義字符類,如上:[0-9] 表示從0-9的數字


+ 說明前面的字符能夠被重複匹配1次或數次,如上:[0-9]+,表示任何數字組合


\ 字符轉義,如上:轉義.


其它:


[L] 表示last,中止匹配其它


方法以下:


1,打開httpd.conf文件,找到


#LoadModule rewrite_module modules/mod_rewrite.so 註釋前面#


2,打開httpd-vhosts.conf文件,在VirtualHost添加劇寫規則,


RewriteEngine On


RewriteRule ^p([0-9]+)\.html      /?p=$1     [L]


基本上就上面這兩個步驟,其實總的來講,Apache中URL地址重寫仍是比較簡單的,比看文檔學習要快的多,不過要想深刻了解仍是有必要看看相關文檔的,其它規則能夠自定義。記住一點:任何匹配其實就是一個正則表達式的替換過程。


建立友好的搜索引擎URL地址對於PHP程序員來講很是重要,所以簡單學會Apache中URL地址重寫將是一項最基本的要求。
 


第二種方法:


1,首先檢查是否已安裝rewrite模塊:


cat httpd.conf | grep rewrite
LoadModule rewrite_module modules/mod_rewrite.so


2,生成僞靜態html鏈接:


(1)生成僞靜態html


在<VirtualHost>段最後加入


RewriteEngine on
RewriteRule /goods([0-9]+).html /goods.php?id=$1 [PT] 
更標準的寫法爲:
RewriteRule ^(.*)/goods([0-9]+).html$ $1/goods.php?id=$2 [PT]
更簡潔的寫法:
/goods(\d+)\.html /goods\.php\?id=$1


第一個(0-9]+)對應參數$1,以此類推第二個對應$2


舉例:


RewriteRule /forum-([0-9]+)-([0-9]+)\.html /forumdisplay.php?fid=$1&page=$2 [PT]


測試http://www.xxx.com/goods1.html 是否與/goods.php?id=1的內容相同


最後將全部連接換成設置後的僞靜態html地址方式




[PT]:url全局轉換,即轉換過的goods31.html對應goods.php?id=31 (默認就是這個不加參數)
[R]:    url重定向  即便用goods31.html訪問時跳轉到goods.php?id=31




3,防盜鏈:


RewriteCrond %{HTTP_HOST} !upkiller.com [R=301,L]
RewriteRule ^(.*)$ http://www.upkiller.com/warning.html [R=301,L]


把不是來自upkiller.com的請求重定向到http://www.upkiller.com


更好的作法:
RewriteCond %{HTTP_REFERER} !^http://(www\.)?upkiller\.com/.*$ [NC]
RewriteRule \.(mp3|rar|jpe|gif)$ http://www.upkiller.com/warning.jpg [R=301,L]


4,防百度爬蟲:
RewriteCond %{HTTP_USER_AGENT} ^Baiduspider [OR]
RewriteRule ^(.*)$ http://www.google.com [R=301,L]
把來自百度的爬蟲轉到goole
 






PS:PHP僞靜態方式


方法一: 


好比這個網頁 


http://www.xxxx.com/soft.php/1,100,8630.html 


其實處理的腳本是soft.php 參數爲1,100,8630 


至關於soft.php?a=1&b=1=100&c=8630 只不過這樣的URL太難記。搜索引擎也不喜歡。 


真靜態只是徹底生成了HTML。 


客戶端訪問的時候直接輸出。不用腳本解釋。在流量很是大的時候(好比天天有上百萬的訪問量的時候)會起到很好的效果。也就是說服務器端實實在在的存在這個HTML頁面。 


固然在你網站的流量沒有那麼大的時候。URL重寫是最好的方法(我的觀點,大流量的時候能夠考慮負載均衡了。一樣沒有關係) 


附URL重寫的方法有不少種,APACHE,IISREWRITE。甚至PHP腳本均可以直接處理。好比上例中就是PHP腳本直接處理(該方法好處是大流量的時候直接減輕WEB伺服器的壓力。PS:一樣也是我的觀點: 


================================================ 


下面以程序爲例講一下PHP僞靜態的程序實現方法,其實這方法我以前已經有在其它論壇社區發過 


程序爲例: 


http://www.xxxx.com/soft.php/1,100,8630.html 


CODE: 


//利用server變量 取得PATH_INFO信息 該例中爲 /1,100,8630.html 也就是執行腳本名後面的部分 


if(@$path_info =$_SERVER["PATH_INFO"]){ 


//正則匹配一下參數 


if(preg_match("/\/(\d+),(\d+),(\d+)\.html/si",$path_info,$arr_path)){ 


$gid =intval($arr_path[1]); //取得值 1 


$sid =intval($arr_path[2]); //取得值100 


$softid =intval($arr_path[3]); //取得值8630 


}else die("Path:Error!"); 


//至關於soft.php?gid=1&sid=100&softid=8630 




//就是這麼簡單了。~) 


方法二: 


一 打開 Apache 的配置文件 httpd.conf 。 


二 將#LoadModule rewrite_module modules/mod_rewrite前面的#去掉 


三 在 httpd.conf中添加: 


<IfModule mod_rewrite.c> 
RewriteEngine On 
#RewriteCond %{ENV:SCRIPT_URL} (?:index|dispbbs)[-0-9]+.html 
RewriteRule ^(.*?(?:index|dispbbs))-([-0-9]+).html 1.php?__is_apache_rewrite=1&__rewrite_arg=2 
</IfModule> 


四 要實現asp帖子URL到php帖子的映射,在 第三步的<IfModule mod_rewrite.c>和</IfModule>之間添加: 


RewriteMap tolowercase int:tolower 
RewriteCond %{QUERY_STRING} (?:boardid|page|id|replyid|star|skin)=d+ [NC] 
RewriteRule ^(.*(?:index|dispbbs)).asp 1.php?{tolowercase:%{QUERY_STRING}}&__is_apache_rewrite=1 


五 保存httpd.conf並重啓Apache 


方法三: 


<?php 
/* 
功能:PHP僞靜態化頁面的實現 
具體用法: 
例如連接爲:test.php/year/2006/action/_add.html 
mod_rewrite(); 
$yearn=$_GET["year"];//結果爲'2006' 
$action=$_GET["action"];//結果爲'_add' 


*/ 
function mod_rewrite(){ 
global $_GET; 
$nav=$_SERVER["REQUEST_URI"]; 
$script_name=$_SERVER["SCRIPT_NAME"]; 
$nav=substr(ereg_replace("^$script_name","",urldecode($nav)),1); 
$nav=preg_replace("/^.ht(m){1}(l){0,1}$/","",$nav);//這句是去掉尾部的.html或.htm 
$vars = explode("/",$nav); 
for($i=0;$i<Count($vars);$i+=2){ 
$_GET["$vars[$i]"]=$vars[$i+1]; 
} 
return $_GET; 
} 
mod_rewrite(); 
$yearn=$_GET["year"];//結果爲'2006' 
$action=$_GET["action"];//結果爲'_add' 
echo $yearn; 
echo $action; 
?> 


<?php 
/* 
功能:PHP僞靜態化頁面的實現 
具體用法: 
例如連接爲:test.php/year/2006/action/_add.html 
mod_rewrite(); 
$yearn=$_GET["year"];//結果爲'2006' 
$action=$_GET["action"];//結果爲'_add' 


*/ 
function mod_rewrite(){ 
global $_GET; 
$nav=$_SERVER["REQUEST_URI"]; 
$script_name=$_SERVER["SCRIPT_NAME"]; 
$nav=substr(ereg_replace("^$script_name","",urldecode($nav)),1); 
$nav=preg_replace("/^.ht(m){1}(l){0,1}$/","",$nav);//這句是去掉尾部的.html或.htm 
$vars = explode("/",$nav); 
for($i=0;$i<Count($vars);$i+=2){ 
$_GET["$vars[$i]"]=$vars[$i+1]; 
} 
return $_GET; 
} 
mod_rewrite(); 
$yearn=$_GET["year"];//結果爲'2006' 
$action=$_GET["action"];//結果爲'_add' 
echo $yearn; 
echo $action;
相關文章
相關標籤/搜索