今後再也不害怕URI編碼:JavaScript及C# URI編碼詳解

混亂的URI編碼

JavaScript中編碼有三種方法:escape、encodeURI、encodeURIComponenthtml

C#中編碼主要方法:HttpUtility.UrlEncode、Server.UrlEncode、Uri.EscapeUriString、Uri.EscapeDataString編碼

JavaScript中的還好,只提供了三個,C#中主要用的就有這麼多,尚未列出其餘編碼(HTML),一多就弄不明白,弄不 明白就心生恐懼,心生恐懼就變得苦逼,本文就向你們詳細解釋在JavaScript及C#中如何對URI進行編碼的方法(注:本文不涉及到其餘編碼)。url

escape:不推薦使用

緣由:eacape是BOM中的方法,只能對ASCII符號正確編碼,而encodeURI、encodeURIComponent能夠對全部的Unicode符號編碼。ECMAScript v3 反對使用該方法,應用使用 decodeURI() 和 decodeURIComponent() 替代它。spa

escape不編碼字符有69個:*,+,-,.,/,@,_,0-9,a-z,A-Z設計

encodeURI:用於對網址編碼(不包含參數)

encodeURI不編碼字符有82個:!,#,$,&,',(,),*,+,,,-,.,/,:,;,=,?,@,_,~,0-9,a-z,A-Z3d

encodeURI就是爲這個而設計的。encodeURI不對URI中的特殊字符進行編碼,如冒號(:)、斜槓(/)。下面看個示例:code

encodeURI("http://www.cnblogs.com/a file with spaces.html")// outputs http://www.cnblogs.com/a%20file%20with%20spaces.html

能夠看到僅僅把空格替換成了20%,因此此方法可用於對網址進行編碼。htm

因爲encodeURI不對冒號(:)、斜槓(/)進行編碼,因此若是參數(如把網址做爲參數)中包含冒號(:)、斜槓(/),就會解析出錯,因此此方法不能對參數進行編碼。blog

encodeURIComponent:用於對網址參數進行編碼

encodeURIComponent不編碼字符有71個:!, ',(,),*,-,.,_,~,0-9,a-z,A-Zip

能夠看到此方法對:/都進行了編碼,因此不能用它來對網址進行編碼。因爲此方法對中文,空格,井號(#),斜線(/),冒號(:)都進行了編碼,因此適合對URI中的參數進行編碼。看下面的示例:

var param="博客園";var url="http://www.cnblogs.com/?key="+encodeURIComponent(param)+"&page=1";
console.log(url);//outputs http://www.cnblogs.com/?key=%E5%8D%9A%E5%AE%A2%E5%9B%AD&page=1

能夠看到,這正是咱們想要的結果(這裏只對須要編碼的參數(page=1不須要編碼)進行了編碼)。

Server.UrlEncode && HttpUtility.UrlEncode:不推薦

把這兩個放到一塊兒說是由於這兩個方法在絕大多數狀況下是同樣的。它們的區別是HttpUtility.UrlEncode默認使用UTF8格式編碼,而Server.UrlEncode是使用系統預設格式編碼,Server.UrlEncode使用系統預設編碼作爲參數調用HttpUtility.UrlEncode編碼,因此若是系統全局都用UTF8格式編碼,這兩個方法就是同樣的。

這兩個方法是怎麼編碼的呢,咱們來看個示例:

string url1 = "http://www.cnblogs.com/a file with spaces.html?a=1&b=博客園#abc";
Response.Write(HttpUtility.UrlEncode(url1) );//output http%3a%2f%2fwww.cnblogs.com%2fa+file+with+spaces.html%3fa%3d1%26b%3d%e5%8d%9a%e5%ae%a2%e5%9b%ad%23abc

由上面的例子咱們能夠看出,HttpUtility.UrlEncode對冒號(:)和斜槓(/)進行了編碼,因此不能用來對網址進行編碼。

那麼能不能對參數進行編碼呢,答案也是否認的。由於在參數中空格應該被編碼爲%20而不是被HttpUtility.UrlEncode編碼爲加號(+),因此不推薦用這兩個方法對URI進行編碼。

Uri.EscapeUriString:用於對網址編碼(不包含參數)

咱們仍是用例子說話:

string url1 = "http://www.cnblogs.com/a file with spaces.html?a=1&b=博客園#abc";
Response.Write( Uri.EscapeUriString(url1));//outputs: http://www.cnblogs.com/a%20file%20with%20spaces.html?a=1&b=%E5%8D%9A%E5%AE%A2%E5%9B%AD#abc

能夠看出,Uri.EscapeUriString對空格進行了編碼,也對中文進行了編碼,但對冒號(:)、斜槓(/)和井號(#)未編碼,因此此方法能夠用於網址進行編碼,但不能對參數進行編碼,做用相似JavaScript中的encodeURI方法。

Uri.EscapeDataString:用於對網址參數進行編碼

仍然用例子說話:

string url1 = "http://www.cnblogs.com/a file with spaces.html?a=1&b=博客園#abc";
Response.Write(Uri.EscapeDataString(url1));//outputs: http%3A%2F%2Fwww.cnblogs.com%2Fa%20file%20with%20spaces.html%3Fa%3D1%26b%3D%E5%8D%9A%E5%AE%A2%E5%9B%AD%23abc

能夠看出,Uri.EscapeDataString對冒號(:)、斜槓(/)、空格、中文、井號(#)都進行了編碼,因此此方法不能夠用於網址進行編碼,但能夠用於對參數進行編碼,做用相似JavaScript中的encodeURIComponent方法。

小結

在JavaScript中推薦的作法是用encodeURI對URI的網址部分編碼,用encodeURIComponent對URI中傳遞的參數進行編碼。

在C#中推薦的作法是用Uri.EscapeUriString對URI的網址部分編碼,用Uri.EscapeDataString對URI中傳遞的參數進行編碼。

解碼部分就不說了,與編碼方法相對應。

相關文章
相關標籤/搜索