JavaScript/js中,有三個能夠對字符串編碼的函數,分別是: escape,encodeURI,encodeURIComponent,相應3個解碼函數:unescape,decodeURI,decodeURIComponent 。web
escape()函數數據庫
定義和用法 :escape() 函數可對字符串進行編碼,這樣就能夠在全部的計算機上讀取該字符串。瀏覽器
語法 :escape(string)函數
參數 描述 :string 必需。要被轉義或編碼的字符串。 編碼
返回值 :已編碼的 string 的副本。其中某些字符被替換成了十六進制的轉義序列。url
說明 :1.該方法不會對 ASCII 字母和數字進行編碼,也不會對下面這些 ASCII 標點符號進行編碼: - _ . ! ~ * ' ( )spa
2.escape不編碼字符有69個:*,+,-,.,/,@,_,0-9,a-z,A-Z。code
3.其餘全部的字符都會被轉義序列替換。orm
4.目前已經不多使用,建議不用此方式編碼htm
encodeURI()函數
定義和用法 :encodeURI() 函數可把字符串做爲 URI 進行編碼。
語法 :encodeURI(URIstring)
參數 描述 :URIstring 必需。一個字符串,含有 URI 或其餘要編碼的文本。
返回值 :URIstring 的副本,其中的某些字符將被十六進制的轉義序列進行替換。
說明 :該方法不會對 ASCII 字母和數字進行編碼,也不會對這些 ASCII 標點符號進行編碼: - _ . ! ~ * ' ( ) 。
該方法的目的是對 URI 進行完整的編碼,所以對如下在 URI 中具備特殊含義的 ASCII 標點符號,encodeURI() 函數是不會進行轉義的:;/?:@&=+$,#
encodeURI不編碼字符有82個:!,#,$,&,',(,),*,+,,,-,.,/,:,;,=,?,@,_,~,0-9,a-z,A-Z
encodeURIComponent() 函數
定義和用法 :encodeURIComponent() 函數可把字符串做爲 URI 組件進行編碼。
語法 :encodeURIComponent(URIstring)
參數 描述 :URIstring 必需。一個字符串,含有 URI 組件或其餘要編碼的文本。
返回值 :URIstring 的副本,其中的某些字符將被十六進制的轉義序列進行替換。
說明 :該方法不會對 ASCII 字母和數字進行編碼,也不會對這些 ASCII 標點符號進行編碼: - _ . ! ~ * ' ( ) 。
其餘字符(好比 :;/?:@&=+$,# 這些用於分隔 URI 組件的標點符號),都是由一個或多個十六進制的轉義序列替換的。
encodeURIComponent不編碼字符有71個:!, ',(,),*,-,.,_,~,0-9,a-z,A-Z
注:escape對0-255之外的unicode值進行編碼時輸出%u****格式,其它狀況下escape,encodeURI,encodeURIComponent編碼結果相同
提示:請注意 encodeURIComponent() 函數 與 encodeURI() 函數的區別之處,前者假定它的參數是 URI 的一部分(好比協議、主機名、路徑或查詢字符串)。
所以 ,encodeURIComponent() 函數將轉義用於分隔 URI 各個部分的標點符號。
這三個函數,escape()除了 ASCII 字母、數字和特定的符號外,對傳進來的字符串所有進行轉義編碼,所以若是想對URL編碼,最好不要使用此方法。
encodeURI() 用於編碼整個URI,由於URI中的合法字符都不會被編碼轉換。
encodeURIComponent方法在編碼單個URIComponent(指請求參數)應當是最經常使用的,它能夠講參數中的中文、特殊字符進行轉義,而不會影響整個URL。
最經常使用的應爲encodeURIComponent,它是將中文、韓文等特殊字符轉換成utf-8格式的url編碼,因此若是給後臺傳遞參數須要使用encodeURIComponent時須要後臺解碼對utf-8支持(form中的編碼方式和當前頁面編碼方式相同)
GBK:全名爲漢字內碼擴展規範,英文名Chinese Internal Code Specification,是GB2312的擴充,仍然用兩個字節表示漢字。採用雙字節表示,整體編碼範圍爲8140-FEFE,首字節在81-FE 之間,尾字節在40-FE 之間,剔除 xx7F一條線。總計23940 個碼位,共收入21886個漢字和圖形符號,其中漢字(包括部首和構件)21003 個,圖形符號883 個。
UTF-8:(8-bit Unicode Transformation Format)是一種針對Unicode的可變長度字符編碼,又稱萬國碼。UTF-8用1到6個字節編碼UNICODE字符。用在網頁上能夠同一頁面顯示中文簡體繁體及其它語言(如英文,日文,韓文)。
UTF-8和GBK,字符均使用雙字節來表示,只不過爲區分中文,將其最高位都定成1。至於UTF-8編碼則是用以解決國際上字符的一種多字節編碼,它對英文使用8位(即一個字節),中文使用24位(三個字節)來編碼。對於英文字符較多的論壇則用UTF-8節省空間。GBK包含所有中文字符;UTF-8則包含全世界全部國家須要用到的字符。GBK是在國家標準GB2312基礎上擴容後兼容GB2312的標準(好像還不是國家標準)UTF-8編碼的文字能夠在各國各類支持UTF8字符集的瀏覽器上顯示。好比,若是是UTF8編碼,則在外國人的英文IE上也能顯示中文,而無需他們下載IE的中文語言支持包。 因此,對於英文比較多的論壇 ,使用GBK則每一個字符佔用2個字節,而使用UTF-8英文卻只佔一個字節。UTF8是國際編碼,它的通用性比較好,外國人也能夠瀏覽論壇,GBK是國家編碼,通用性比UTF8差,不過UTF8佔用的數據庫比GBK大。
待續!
字符均使用雙字節來表示,只不過爲區分中文,將其最高位都定成1。至於UTF-8編碼則是用以解決國際上字符的一種多字節編碼,它對英文使用8位(即一個字節),中文使用24位(三個字節)來編碼。對於英文字符較多的論壇則用UTF-8節省空間。GBK包含所有中文字符;UTF-8則包含全世界全部國家須要用到的字符。GBK是在國家標準GB2312基礎上擴容後兼容GB2312的標準(好像還不是國家標準)UTF-8編碼的文字能夠在各國各類支持UTF8字符集的瀏覽器上顯示。好比,若是是UTF8編碼,則在外國人的英文IE上也能顯示中文,而無需他們下載IE的中文語言支持包。 因此,對於英文比較多的論壇 ,使用GBK則每一個字符佔用2個字節,而使用UTF-8英文卻只佔一個字節。UTF8是國際編碼,它的通用性比較好,外國人也能夠瀏覽論壇,GBK是國家編碼,通用性比UTF8差,不過UTF8佔用的數據庫比GBK大 字符均使用雙字節來表示,只不過爲區分中文,將其最高位都定成1。
至於UTF-8編碼則是用以解決國際上字符的一種多字節編碼,它對英文使用8位(即一個字節),中文使用24位(三個字節)來編碼。對於英文字符較多的論壇則用UTF-8節省空間。
GBK包含所有中文字符;UTF-8則包含全世界全部國家須要用到的字符。
GBK是在國家標準GB2312基礎上擴容後兼容GB2312的標準(好像還不是國家標準) UTF-8編碼的文字能夠在各國各類支持UTF8字符集的瀏覽器上顯示。 好比,若是是UTF8編碼,則在外國人的英文IE上也能顯示中文,而無需他們下載IE的中文語言支持包。 因此,對於英文比較多的論壇 ,使用GBK則每一個字符佔用2個字節,而使用UTF-8英文卻只佔一個字節。
UTF8是國際編碼,它的通用性比較好,外國人也能夠瀏覽論壇,GBK是國家編碼,通用性比UTF8差,不過UTF8佔用的數據庫比GBK大UTF-8(8-bit Unicode Transformation Format)是一種針對Unicode的可變長度字符編碼,又稱萬國碼。UTF-8用1到6個字節編碼UNICODE字符。用在網頁上能夠同一頁面顯示中文簡體繁體及其它語言(如英文,日文,韓文)。
UTF-8(8-bit Unicode Transformation Format)是一種針對Unicode的可變長度字符編碼,又稱萬國碼。 UTF-8(8-bit Unicode Transformation Format)是一種針對Unicode的可變長度字符編碼,又稱萬國碼。 UTF-8(8-bit Unicode Transformation Format)是一種針對Unicode的可變長度字符編碼,又稱萬國碼。UTF-8(8-bit Unicode Transformation Format)是一種針對Unicode的可變長度字符編碼,又稱萬國碼。UTF-8(8-bit Unicode Transformation Format)是一種針對Unicode的可變長度字符編碼,又稱萬國碼。UTF-8(8-bit Unicode Transformation Format)是一種針對Unicode的可變長度字符編碼,又稱萬國碼。