escape,encodeURI,encodeURIComponent

時間 2019-12-13

標籤 escape encodeuri encodeuricomponent 简体版

原文原文鏈接

JavaScript/js中，有三個能夠對字符串編碼的函數，分別是： escape,encodeURI,encodeURIComponent，相應3個解碼函數：unescape,decodeURI,decodeURIComponent 。web

escape()函數數據庫

定義和用法：escape() 函數可對字符串進行編碼，這樣就能夠在全部的計算機上讀取該字符串。瀏覽器

語法：escape(string)函數

參數描述：string 必需。要被轉義或編碼的字符串。編碼

返回值：已編碼的 string 的副本。其中某些字符被替換成了十六進制的轉義序列。url

說明：1.該方法不會對 ASCII 字母和數字進行編碼，也不會對下面這些 ASCII 標點符號進行編碼： - _ . ! ~ * ' ( )spa

2.escape不編碼字符有69個：*，+，-，.，/，@，_，0-9，a-z，A-Z。code

3.其餘全部的字符都會被轉義序列替換。orm

4.目前已經不多使用，建議不用此方式編碼htm

encodeURI()函數

定義和用法：encodeURI() 函數可把字符串做爲 URI 進行編碼。

語法：encodeURI(URIstring)

參數描述：URIstring 必需。一個字符串，含有 URI 或其餘要編碼的文本。

返回值：URIstring 的副本，其中的某些字符將被十六進制的轉義序列進行替換。

說明：該方法不會對 ASCII 字母和數字進行編碼，也不會對這些 ASCII 標點符號進行編碼： - _ . ! ~ * ' ( ) 。

該方法的目的是對 URI 進行完整的編碼，所以對如下在 URI 中具備特殊含義的 ASCII 標點符號，encodeURI() 函數是不會進行轉義的：;/?:@&=+$,#

encodeURI不編碼字符有82個：!，#，$，&，'，(，)，*，+，,，-，.，/，:，;，=，?，@，_，~，0-9，a-z，A-Z

encodeURIComponent() 函數

定義和用法：encodeURIComponent() 函數可把字符串做爲 URI 組件進行編碼。

語法：encodeURIComponent(URIstring)

參數描述：URIstring 必需。一個字符串，含有 URI 組件或其餘要編碼的文本。

返回值：URIstring 的副本，其中的某些字符將被十六進制的轉義序列進行替換。

說明：該方法不會對 ASCII 字母和數字進行編碼，也不會對這些 ASCII 標點符號進行編碼： - _ . ! ~ * ' ( ) 。

其餘字符（好比：;/?:@&=+$,# 這些用於分隔 URI 組件的標點符號），都是由一個或多個十六進制的轉義序列替換的。

encodeURIComponent不編碼字符有71個：!， '，(，)，*，-，.，_，~，0-9，a-z，A-Z

注：escape對0-255之外的unicode值進行編碼時輸出%u****格式，其它狀況下escape，encodeURI，encodeURIComponent編碼結果相同

提示：請注意 encodeURIComponent() 函數與 encodeURI() 函數的區別之處，前者假定它的參數是 URI 的一部分（好比協議、主機名、路徑或查詢字符串）。

所以，encodeURIComponent() 函數將轉義用於分隔 URI 各個部分的標點符號。

這三個函數，escape()除了 ASCII 字母、數字和特定的符號外，對傳進來的字符串所有進行轉義編碼，所以若是想對URL編碼，最好不要使用此方法。

encodeURI() 用於編碼整個URI,由於URI中的合法字符都不會被編碼轉換。

encodeURIComponent方法在編碼單個URIComponent（指請求參數）應當是最經常使用的，它能夠講參數中的中文、特殊字符進行轉義，而不會影響整個URL。

最經常使用的應爲encodeURIComponent，它是將中文、韓文等特殊字符轉換成utf-8格式的url編碼，因此若是給後臺傳遞參數須要使用encodeURIComponent時須要後臺解碼對utf-8支持（form中的編碼方式和當前頁面編碼方式相同）

GBK：全名爲漢字內碼擴展規範，英文名Chinese Internal Code Specification，是GB2312的擴充，仍然用兩個字節表示漢字。採用雙字節表示，整體編碼範圍爲8140-FEFE，首字節在81-FE 之間，尾字節在40-FE 之間，剔除 xx7F一條線。總計23940 個碼位，共收入21886個漢字和圖形符號，其中漢字（包括部首和構件）21003 個，圖形符號883 個。

UTF-8：（8-bit Unicode Transformation Format）是一種針對Unicode的可變長度字符編碼，又稱萬國碼。UTF-8用1到6個字節編碼UNICODE字符。用在網頁上能夠同一頁面顯示中文簡體繁體及其它語言（如英文，日文，韓文）。

UTF-8和GBK，字符均使用雙字節來表示，只不過爲區分中文，將其最高位都定成1。至於UTF－8編碼則是用以解決國際上字符的一種多字節編碼，它對英文使用8位（即一個字節），中文使用24位（三個字節）來編碼。對於英文字符較多的論壇則用UTF－8節省空間。GBK包含所有中文字符；UTF-8則包含全世界全部國家須要用到的字符。GBK是在國家標準GB2312基礎上擴容後兼容GB2312的標準（好像還不是國家標準）UTF-8編碼的文字能夠在各國各類支持UTF8字符集的瀏覽器上顯示。好比，若是是UTF8編碼，則在外國人的英文IE上也能顯示中文，而無需他們下載IE的中文語言支持包。因此，對於英文比較多的論壇，使用GBK則每一個字符佔用2個字節，而使用UTF－8英文卻只佔一個字節。UTF8是國際編碼，它的通用性比較好，外國人也能夠瀏覽論壇，GBK是國家編碼，通用性比UTF8差，不過UTF8佔用的數據庫比GBK大。

待續！
字符均使用雙字節來表示，只不過爲區分中文，將其最高位都定成1。至於UTF－8編碼則是用以解決國際上字符的一種多字節編碼，它對英文使用8位（即一個字節），中文使用24位（三個字節）來編碼。對於英文字符較多的論壇則用UTF－8節省空間。GBK包含所有中文字符；UTF-8則包含全世界全部國家須要用到的字符。GBK是在國家標準GB2312基礎上擴容後兼容GB2312的標準（好像還不是國家標準）UTF-8編碼的文字能夠在各國各類支持UTF8字符集的瀏覽器上顯示。好比，若是是UTF8編碼，則在外國人的英文IE上也能顯示中文，而無需他們下載IE的中文語言支持包。因此，對於英文比較多的論壇，使用GBK則每一個字符佔用2個字節，而使用UTF－8英文卻只佔一個字節。UTF8是國際編碼，它的通用性比較好，外國人也能夠瀏覽論壇，GBK是國家編碼，通用性比UTF8差，不過UTF8佔用的數據庫比GBK大字符均使用雙字節來表示，只不過爲區分中文，將其最高位都定成1。
至於UTF－8編碼則是用以解決國際上字符的一種多字節編碼，它對英文使用8位（即一個字節），中文使用24位（三個字節）來編碼。對於英文字符較多的論壇則用UTF－8節省空間。
GBK包含所有中文字符；UTF-8則包含全世界全部國家須要用到的字符。
GBK是在國家標準GB2312基礎上擴容後兼容GB2312的標準（好像還不是國家標準） UTF-8編碼的文字能夠在各國各類支持UTF8字符集的瀏覽器上顯示。好比，若是是UTF8編碼，則在外國人的英文IE上也能顯示中文，而無需他們下載IE的中文語言支持包。因此，對於英文比較多的論壇，使用GBK則每一個字符佔用2個字節，而使用UTF－8英文卻只佔一個字節。
UTF8是國際編碼，它的通用性比較好，外國人也能夠瀏覽論壇，GBK是國家編碼，通用性比UTF8差，不過UTF8佔用的數據庫比GBK大UTF-8（8-bit Unicode Transformation Format）是一種針對Unicode的可變長度字符編碼，又稱萬國碼。UTF-8用1到6個字節編碼UNICODE字符。用在網頁上能夠同一頁面顯示中文簡體繁體及其它語言（如英文，日文，韓文）。

UTF-8（8-bit Unicode Transformation Format）是一種針對Unicode的可變長度字符編碼，又稱萬國碼。 UTF-8（8-bit Unicode Transformation Format）是一種針對Unicode的可變長度字符編碼，又稱萬國碼。 UTF-8（8-bit Unicode Transformation Format）是一種針對Unicode的可變長度字符編碼，又稱萬國碼。UTF-8（8-bit Unicode Transformation Format）是一種針對Unicode的可變長度字符編碼，又稱萬國碼。UTF-8（8-bit Unicode Transformation Format）是一種針對Unicode的可變長度字符編碼，又稱萬國碼。UTF-8（8-bit Unicode Transformation Format）是一種針對Unicode的可變長度字符編碼，又稱萬國碼。

相關標籤/搜索

encodeuricomponent

encodeuri

escape

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。