UrlRewriter技術簡單運用

         如何加強你網站中地址的可讀性和讓搜索引擎快速的收錄到你的站點,這就須要你美化你的網頁的地址,也就是咱們常說的Url重寫技術,你們熟悉的可能有不少服務器都提供Url重寫的技術,之前咱們用的最多的就是Apache,Jboss這樣一些服務器自帶的一些Url重寫,可是他們的配置比較麻煩,性能又不是太好,如今咱們有專注的開源框架來完成Url重寫任務,今天我要介紹的就是UrlRewriter。使用起來比較簡單,配置是至關的簡單明瞭。
     咱們先簡單的瞭解一下使用Url重寫能給你網站帶來哪些好處。
    第一:有利於搜索引擎的抓取,由於如今大部分的搜索引擎對動態頁面的抓取還比較弱,它們更喜歡抓取一些靜態的頁面。而咱們如今的頁面大部分的數據都是動態的顯示的。這就須要咱們把動態頁面變成靜態的頁面,有利於搜索引擎的抓取。
   第二:讓用戶更容易理解,不多有用戶去關心你網站的頁面的地址,但對通常的大中型網站加強可讀性仍是必須的。這樣會讓你的網站更加完美。
  第三:隱藏技術的實現,咱們能夠經過Url重寫能夠實現技術的隱藏。不至於暴露你所採用的技術,給一些想***你網站的愛好者提供方便。
  第四:能夠很方便的重用,提升網站的移植性。若是咱們後臺方法改動的話,能夠保證前臺的頁面部分不用改。這樣就提升了網站的移植性。
   它雖然有這麼多的優勢,可是也有一點缺點的,由於它是經過過濾器原理來實現的,就覺得着又多了一道訪問,會多少影響點訪問速度的,這個能夠忽略不計的。
   如今UrlRewriter技術有兩個技術平臺的,一個就是在Java方向的,另外一個就是.NET方向的。今天咱們講的是Java方向的應用。
   首先讓咱們瞭解它的工做原理,說白了它就是一個簡單的過濾器(Filter) ,看看源碼你就會很快的明白,它就是經過咱們在jsp中經常使用的兩個方法實現的forward(),sendRedirect().
   下面咱們就快速的爲你的網站搭建Url重寫技術。
    第一步:下載urlrewrite-2.6.0.如今最新版本是3.1的。([url]http://tuckey.org/urlrewrite/dist/urlrewritefilter-2.6.zip[/url]
   第二步:在WEB-INF目錄下建一個urlrewrite.xml文件。
   第三步:在web.xml中初始化。加上下面的代碼:
   <!-- Set URL Rewrite-->
 <filter>
  <filter-name>UrlRewriteFilter</filter-name>
  <filter-class>
   org.tuckey.web.filters.urlrewrite.UrlRewriteFilter
  </filter-class>
 </filter>
 <filter-mapping>
  <filter-name>UrlRewriteFilter</filter-name>
  <url-pattern>/*</url-pattern>
 </filter-mapping>
    最後我要簡單的講一下經常使用的兩個配置規則.如下就是簡單的urlrewrite.xml配置片斷。不要習慣Java的命名法把它寫成urlRewrite.xml,這樣即便你加上
<init-param>
   <param-name>confPath</param-name>
   <param-value>/WEB-INF/urlRewrite.xml</param-value>
 </init-param>
  在啓動的服務器的時候仍是會報錯的,由於源碼中必須是全小寫的(urlrewrite.xml)且只能放到WEB-INF下面。
     <?xml version="1.0" encoding="utf-8"?>
<!DOCTYPE urlrewrite PUBLIC "-//tuckey.org//DTD UrlRewrite 2.6//EN"
        "[url]http://tuckey.org/res/dtds/urlrewrite2.6.dtd[/url]">
<urlrewrite>
  <rule>
  <from>^/(\w+)/(\w+)/page_(\d+)\.html$</from>
  <to type="forward">/$1.htm?category=$2&amp;page=$3</to>
 </rule>
  <rule>
     <from>^/rss/yahoo\.html$</from>
       <to type="redirect">    [url]http://add.my.yahoo.com/rss? url=http://feed.feedsky.com/W3CSSiteFeed[/url]
      </to>
 </rule>
</urlrewrite>
   全部的規則配置都寫在這裏。第一個經常使用個規則就是站內的簡單重寫。
<rule>
  <from></from>
  <to type="forward></to>
</rule>
  <from></from>寫上你本身定義的訪問地址,<to type="forward></to>就是實際的訪問地址。好比咱們實際的訪問地址是:[url]http://yousite.com/entity.htm[/url] ?category=user&page=2.而咱們想把它重寫爲[url]http://yousite.com/entity/uesr/page_2.html[/url]。這樣看起來比咱們實際的要好看的多。咱們就應該這樣的寫:  
<rule>
  <from>^/(\w+)/(\w+)/page_(\d+)\.html$</from>
  <to type="forward">/$1.htm?category=$2&amp;page=$3</to>
 </rule>
   簡單的介紹一下經常使用的正規表示式:
 
代碼 說明
. 匹配除換行符之外的任意字符
\w 匹配字母或數字或下劃線或漢字
\s 匹配任意的空白符
\d 匹配數字
\b 匹配單詞的開始或結束
^ 匹配字符串的開始
$ 匹配字符串的結束
經常使用的&要用  &amp;來表示。$1,$2表明與你配置正規表達式/(\w+)/(\w+)/相對應的參數。<to type="forward">默認的是 type="forward".
  另外一個經常使用的規則就是鏈接外部的網站。就要用到。<to type="redirect">
 <rule>
     <from>^/rss/yahoo\.html$</from>
       <to type="redirect">    [url]http://add.my.yahoo.com/rss? url=http://feed.feedsky.com/MySiteFeed[/url]
      </to>
 </rule>
   咱們的網站用到最多的無非就這兩種規則。至於正規表達式的寫法不少種。但願對有感興趣的朋友,能夠試試。
相關文章
相關標籤/搜索