rawurlencode() urlencode() 函數 分析


rawurlencodejavascript

string rawurlencode ( string $str )php

返回字符串,此字符串中除了 -_. 以外的全部非字母數字字符都將被替換成百分號(%)後跟兩位十六進制數。這是在 RFC 1738 中描述的編碼,是爲了保護原義字符以避免其被解釋爲特殊的 URL 定界符,同時保護 URL 格式以避免其被傳輸媒體(像一些郵件系統)使用字符轉換時弄亂。例如,若是你想在 FTP 的 URL 中包含密碼:html

Example #1 rawurlencode() 示例 1java

<?php
echo '<a href="ftp://user:'rawurlencode('foo @+%/'),
     
'@ftp.example.com/x.txt">';
?>
瀏覽器

或者,若是你想經過 URL 的 PATH_INFO 構成部分去傳遞信息:app

Example #2 rawurlencode() 示例 2函數

<?php
echo '<a href="http://example.com/department_list_script/',
    
rawurlencode('sales and marketing/Miami'), '">';
?>
編碼


urldecodeurl

string urldecode ( string $str )spa

解碼給出的已編碼字符串中的任何 %##。返回解碼後的字符串。

Example #1 urldecode() 例子

<?php
$a 
explode('&'$QUERY_STRING);
$i 0;
while (
$i count($a)) {
    
$b split('='$a[$i]);
    echo 
'Value for parameter 'htmlspecialchars(urldecode($b[0])),
         
' is 'htmlspecialchars(urldecode($b[1])), "<br /> ";
    
$i++;
}
?>


PHP中對於URL進行編碼,可使用 urlencode() 或者 rawurlencode(),兩者的區別是前者把空格編碼爲 '+',然後者把空格編碼爲 '%20',不過應該注意的是,在編碼時應該只對部分URL編碼,不然URL中的冒號和反斜槓也會被轉義。


下面是詳細解釋:
string urlencode ( string str) 
返回字符串,此字符串中除了 -_. 以外的全部非字母數字字符都將被替換成百分號(%)後跟兩位十六進制數,空格則編碼爲加號(+)。此編碼與 WWW 表單 POST 數據的編碼方式是同樣的,同時與 application/x-www-form-urlencoded 的媒體類型編碼方式同樣。因爲歷史緣由,此編碼在將空格編碼爲加號(+)方面與 RFC1738 編碼(參見 rawurlencode())不一樣。此函數便於將字符串編碼並將其用於 URL 的請求部分,同時它還便於將變量傳遞給下一頁: 例子 1. urlencode() 示例 


代碼以下:

<?php 
echo '<a href="mycgi?foo=', urlencode($userinput), '">'; 
?> 


注意:當心與 HTML 實體相匹配的變量。像 &、© 和 £ 都將被瀏覽器解析,並使用實際實體替代所期待的變量名。這是明顯的混亂,W3C 已經告誡人們好幾年了。參考地址:http://www.w3.org/TR/html4/appendix/notes.html#h-B.2.2 PHP 經過 arg_separator .ini 指令,支持將參數分割符變成 W3C 所建議的分號。不幸的是大多數用戶代理並不發送分號分隔符格式的表單數據。較爲簡單的解決辦法是使用 & 代替 & 做爲分隔符。你不須要爲此修改 PHP 的 arg_separator。讓它仍爲 &,而僅使用 htmlentities(urlencode($data)) 對你的 URL 進行編碼。 
例子 2. urlencode() 與 htmlentities() 示例 


代碼以下:

<?php 
echo '<a href="mycgi?foo=', htmlentities(urlencode($userinput)), '">'; 
?> 



string urlencode ( string str) 
返回字符串,此字符串中除了 -_. 以外的全部非字母數字字符都將被替換成百分號(%)後跟兩位十六進制數。這是在 RFC 1738 中描述的編碼,是爲了保護原義字符以避免其被解釋爲特殊的 URL 定界符,同時保護 URL 格式以避免其被傳輸媒體(像一些郵件系統)使用字符轉換時弄亂。例如,若是你想在 FTP 的 URL 中包含密碼: 
例子 1. rawurlencode() 示例 1 


代碼以下:

<?php 
echo '<a href="ftp://user:', rawurlencode('foo @+%/'), 
'@ftp.my.com/x.txt">'; 
?> 



或者,若是你想經過 URL 的 PATH_INFO 構成部分去傳遞信息: 
例子 2. rawurlencode() 示例 2 


代碼以下:

<?php 
echo '<a href="http://x.com/department_list_script/', 
rawurlencode('sales and marketing/Miami'), '">'; 
?> 



在解碼時,可使用相應的 urldecode() 和 rawurldecode(),相應地,rawurldecode() 不會把加號('+')解碼爲空格,而 urldecode() 能夠。 下面是詳細示例: 
string urldecode ( string str) 
解碼給出的已編碼字符串中的任何 %##。返回解碼後的字符串。 例子 1. urldecode() example 

代碼以下:

<?php 
$a = explode('&', $QUERY_STRING); 
$i = 0; 
while ($i < count($a)) { 
$b = split('=', $a[$i]); 
echo 'Value for parameter ', htmlspecialchars(urldecode($b[0])), 
' is ', htmlspecialchars(urldecode($b[1])), "<br />n"; 
$i++; 

?> 


string rawurldecode ( string str) 
返回字符串,此字符串中百分號(%)後跟兩位十六進制數的序列都將被替換成原義字符。 
例子 1. rawurldecode() 示例 


代碼以下:

<?php 
echo rawurldecode('foo%20bar%40baz'); // foo bar@baz 
?> 


可是,有一點須要注意的地方是,urldecode() 和 rawurldecode() 解碼出的字符串是 UTF-8格式的編碼,若是URL中含有中文的話,而頁面設置又不是 UTF-8 的話,則要把解碼出的字符串進行轉換,才能正常顯示! 
還有一個問題,就是所得到的 URL 不是 %%nn n={0..F} 的格式,而是 %unnnn n={0..F} 的格式,這時候再使用 urldecode() 和 rawurldecode() 是沒法正確解碼的,而要用下面這個函數才能正確解碼: 

代碼以下:

function utf8RawUrlDecode ($source) 

$decodedStr = ""; 
$pos = 0; 
$len = strlen ($source); 
while ($pos < $len) { 
$charAt = substr ($source, $pos, 1); 
if ($charAt == '%') { 
$pos++; 
$charAt = substr ($source, $pos, 1); 
if ($charAt == 'u') { 
// we got a unicode character 
$pos++; 
$unicodeHexVal = substr ($source, $pos, 4); 
$unicode = hexdec ($unicodeHexVal); 
$entity = "&#". $unicode . ';'; 
$decodedStr .= utf8_encode ($entity); 
$pos += 4; 

else { 
// we have an escaped ascii character 
$hexVal = substr ($source, $pos, 2); 
$decodedStr .= chr (hexdec ($hexVal)); 
$pos += 2; 

} else { 
$decodedStr .= $charAt; 
$pos++; 


return $decodedStr; 



2個函數都是針對字符串轉義使其適合作文件名。該用哪一個?哪一個更標準?

結論:
rawurlencode遵照是94年國際標準備忘錄RFC 1738,
urlencode實現的是傳統作法,和上者的主要區別是對空格的轉義是'+'而不是'%20'
javascript的encodeURL也是94年標準,

而javascript的escape是另外一種用"%xxx"標記unicode編碼的方法。

推薦在PHP中使用用rawurlencode。棄用urlencode

樣例
source:

超級無敵的人sadha sajdh數據樣本sdls fhejrthcxzb.file.jpeg

PHP urlencode: 
%E8%B6%85%E7%BA%A7%E6%97%A0%E6%95%8C%E7%9A%84%E4%BA%BAsadha+sajdh%E6%95%B0%E6%8D%AE%E6%A0%B7%E6%9C%ACsdls+fhejrthcxzb.file.jpeg

PHP rawurlencode: 
%E8%B6%85%E7%BA%A7%E6%97%A0%E6%95%8C%E7%9A%84%E4%BA%BAsadha%20sajdh%E6%95%B0%E6%8D%AE%E6%A0%B7%E6%9C%ACsdls%20fhejrthcxzb.file.jpeg

Javascript encodeURI: 
%E8%B6%85%E7%BA%A7%E6%97%A0%E6%95%8C%E7%9A%84%E4%BA%BAsadha%20sajdh%E6%95%B0%E6%8D%AE%E6%A0%B7%E6%9C%ACsdls%20fhejrthcxzb.file.jpeg

Javascript escape: %u8D85%u7EA7%u65E0%u654C%u7684%u4EBAsadha%20sajdh%u6570%u636E%u6837%u672Csdls%20fhejrthcxzb.file.jpeg 

相關文章
相關標籤/搜索