轉自:https://segmentfault.com/a/1190000008305573php
PHP中有兩個函數pack和unpack,不少PHPer在實際項目中歷來沒有使用過,甚至也不知道這兩個方法是用來幹嗎的。這篇文章來爲你們介紹一下它倆究竟是用來幹啥的。linux
string pack ( string $format [, mixed $args [, mixed $... ]] )
該函數用來將對應的參數($args
)打包成二進制字符串。segmentfault
其中第一個參數$format,有以下選項(可選參數不少,後面會選幾個經常使用的講解):網絡
Code | Description |
---|---|
a | 以NUL字節填充字符串空白 |
A | 以SPACE(空格)填充字符串 |
h | 十六進制字符串,低位在前 |
H | 十六進制字符串,高位在前 |
c | 有符號字符 |
C | 無符號字符 |
s | 有符號短整型(16位,主機字節序) |
S | 無符號短整型(16位,主機字節序) |
n | 無符號短整型(16位,大端字節序) |
v | 無符號短整型(16位,小端字節序) |
i | 有符號整型(機器相關大小字節序) |
I | 無符號整型(機器相關大小字節序) |
l | 有符號長整型(32位,主機字節序) |
L | 無符號長整型(32位,主機字節序) |
N | 無符號長整型(32位,大端字節序) |
V | 無符號長整型(32位,小端字節序) |
q | 有符號長長整型(64位,主機字節序) |
Q | 無符號長長整型(64位,主機字節序) |
J | 無符號長長整型(64位,大端字節序) |
P | 無符號長長整型(64位,小端字節序) |
f | 單精度浮點型(機器相關大小) |
d | 雙精度浮點型(機器相關大小) |
x | NUL字節 |
X | 回退一字節 |
Z | 以NUL字節填充字符串空白(new in PHP 5.5) |
@ | NUL填充到絕對位置 |
這麼多參數看下來,我第一次是真心懵逼了,大部分說明都很好理解,可是其中的主機、大端、小端等字節序是什麼鬼呢?接下里的內容比較枯燥,但必須理解才行,堅持吧。函數
就是字節的順序,說白了就是多字節數據的存放順序(一個字節顯然不須要順序)。
好比A
和B
分別對應的二進制表示爲0100 0001
、0100 0010
。對於儲存字符串AB
,咱們能夠0100 0001 0100 0010
也能夠0100 0010 0100 0001
,這個順序就是所謂的字節序。加密
好比字符串AB
,左高右低(咱們正常的閱讀順序),A
爲高字節,B
爲低字節spa
假設0x123456是按從高位到底位的順序儲存,內存中是這樣存放的:unix
高地址 -> 低地址
12 -> 34 -> 56code
大端就是將高位字節放到內存的低地址端,低位字節放到高地址端。網絡傳輸中(好比TCP/IP)低地址端(高位字節)放在流的開始,對於2個字節的字符串(AB
),傳輸順序爲:A
(0-7bit)、B
(8-15bit)。
那麼小端字節序天然和大端相反。orm
表示當年機器的字節序(也就是網絡字節序是肯定的,而主機字節序是依機器肯定的),通常
爲小端字節序。
$string = pack('a6', 'china'); var_dump($string); //輸出結果: string(6) "china",最後一個字節是不可見的NUL echo ord($string[5]); //輸出結果: 0(ASCII碼中0對應的就是nul) //A同理 $string = pack('A6', 'china'); var_dump($string); //輸出結果: string(6) "china ",最後一個字節是空格 echo ord($string[5]); //輸出結果: 32(ASCII碼中32對應的就是空格)
附贈ASCII表一張(linux/unix下可使用man ascii
查看)
$string = pack('H3', 281); var_dump($string); //輸出結果: string(2) "(" for($i=0;$i<strlen($string);$i++) { echo ord($string[$i]) . PHP_EOL; } //輸出結果: 40 16
h和H須要特殊說明一下,它們是將對應的參數看作十六進制字符而後打包。什麼意思呢?好比上面的281
,打包前會將281
轉換爲0x281
,由於十六進制的一位對應二進制的四位,上面的0x281
只有1.5個字節,後面會默認補0變成0x2810
,0x28對應的十進制爲40((
),0x10對應的十進制爲16(dle
不可見字符),懂了吧?不懂能夠給我留言。。
$string = pack('c3', 67, 68, -1); var_dump($string); //輸出:string(3) "CD�" for($i=0;$i<strlen($string);$i++) { echo ord($string[$i]) . PHP_EOL; } //輸出: 67 68 225
最後輸出本能應該以爲是67 68 -1
ord獲取的是字符的ASCII碼(範圍0-255
),這時-1(0000 0001)
對應的字符將以補碼的形式輸出也就是255(1111 1110 + 0000 0001 = 1111 1111)
全部的整型類型使用方法徹底同樣,主要注意它們的位和字節序就能夠了,下面以L做爲例子展現
$string = pack('L', 123456789); var_dump($string); //輸出:string(4) "�[" for($i=0;$i<strlen($string);$i++) { echo ord($string[$i]) . PHP_EOL; } //輸出: 21 205 91 7
$string = pack('f', 12345.123); var_dump($string); //輸出:string(4) "~�@F" var_dump(unpack('f', $string)); //這裏提早用到了unpack,後面會講解 //輸出:float(12345.123046875)
f和d是針對浮點數打包,至於爲何打包前是12345.123
解包後是12345.123046875
,這個和浮點數的儲存有關係,後面能夠單開一個文章講解一下IEEE標準
$string = pack('x'); //打包一個nul字符串 echo ord($string); //輸出: 0
關於X(大寫X)
,試了N次,沒搞明白怎麼用,有清楚的童鞋能夠給我留言,多謝。
$string = pack('Z2', 'abc5'); //其實就是將從Z後面的數字位置開始,所有設置爲nul var_dump($string); //輸出:string(2) "a" for($i=0;$i<strlen($string);$i++) { echo ord($string[$i]) . PHP_EOL; } //輸出: 97 0
$string = pack('@4'); //我理解爲填充N個nul var_dump($string); //輸出: string(4) "" for($i=0;$i<strlen($string);$i++) { echo ord($string[$i]) . PHP_EOL; } //輸出: 0 0 0 0
array unpack ( string $format , string $data )
unpack的使用至關簡單,就是講pack打包的數據解包,打包的時候用的什麼參數,就用什麼參數解包,具體使用懶得說了,列幾個小例子
$string = pack('L4', 1, 2, 3, 4); var_dump(unpack('L4', $string)); //輸出: array(4) { [1]=> int(1) [2]=> int(2) [3]=> int(3) [4]=> int(4) } $string = pack('L4', 1, 2, 3, 4); var_dump(unpack('Ll1/Ll2/Ll3/Ll4', $string)); //能夠指定key,用/分割 //輸出: array(4) { ["l1"]=> int(1) ["l2"]=> int(2) ["l3"]=> int(3) ["l4"]=> int(4) }
數據通訊(經過二進制格式與其它語言通訊)
數據加密(若是不告訴第三方你的打包方式,對方解包的難度就相對很大)
節省空間(好比比較大的數字按字符串儲存會浪費不少空間,打包成二進制格式才須要4位<32位數字>)
本身去想吧