PHP中pack、unpack的詳細用法

PHP中有兩個函數pack和unpack,不少PHPer在實際項目中歷來沒有使用過,甚至也不知道這兩個方法是用來幹嗎的。這篇文章來爲你們介紹一下它倆究竟是用來幹啥的。

pack

string pack ( string $format [, mixed $args [, mixed $... ]] )

該函數用來將對應的參數($args)打包成二進制字符串。php

其中第一個參數$format,有以下選項(可選參數不少,後面會選幾個經常使用的講解):linux

Code Description
a 以NUL字節填充字符串空白
A 以SPACE(空格)填充字符串
h 十六進制字符串,低位在前
H 十六進制字符串,高位在前
c 有符號字符
C 無符號字符
s 有符號短整型(16位,主機字節序)
S 無符號短整型(16位,主機字節序)
n 無符號短整型(16位,大端字節序)
v 無符號短整型(16位,小端字節序)
i 有符號整型(機器相關大小字節序)
I 無符號整型(機器相關大小字節序)
l 有符號長整型(32位,主機字節序)
L 無符號長整型(32位,主機字節序)
N 無符號長整型(32位,大端字節序)
V 無符號長整型(32位,小端字節序)
q 有符號長長整型(64位,主機字節序)
Q 無符號長長整型(64位,主機字節序)
J 無符號長長整型(64位,大端字節序)
P 無符號長長整型(64位,小端字節序)
f 單精度浮點型(機器相關大小)
d 雙精度浮點型(機器相關大小)
x NUL字節
X 回退一字節
Z 以NUL字節填充字符串空白(new in PHP 5.5)
@ NUL填充到絕對位置

這麼多參數看下來,我第一次是真心懵逼了,大部分說明都很好理解,可是其中的主機、大端、小端等字節序是什麼鬼呢?接下里的內容比較枯燥,但必須理解才行,堅持吧。小程序

字節序是什麼?

就是字節的順序,說白了就是多字節數據的存放順序(一個字節顯然不須要順序)。
好比AB分別對應的二進制表示爲0100 00010100 0010。對於儲存字符串AB,咱們能夠0100 0001 0100 0010也能夠0100 0010 0100 0001,這個順序就是所謂的字節序。網絡

高/低位字節

好比字符串AB,左高右低(咱們正常的閱讀順序),A爲高字節,B爲低字節函數

高/低地址

假設0x123456是按從高位到底位的順序儲存,內存中是這樣存放的:加密

高地址 -> 低地址
12 -> 34 -> 56spa

大端字節序(網絡字節序)

大端就是將高位字節放到內存的低地址端,低位字節放到高地址端。網絡傳輸中(好比TCP/IP)低地址端(高位字節)放在流的開始,對於2個字節的字符串(AB),傳輸順序爲:A(0-7bit)、B(8-15bit)。
那麼小端字節序天然和大端相反。unix

主機字節序

表示當年機器的字節序(也就是網絡字節序是肯定的,而主機字節序是依機器肯定的),通常爲小端字節序。code

a和A(打包字符串,用NUL或者空格填充)

$string = pack('a6', 'china');
var_dump($string); //輸出結果: string(6) "china",最後一個字節是不可見的NUL
echo ord($string[5]); //輸出結果: 0(ASCII碼中0對應的就是nul)

//A同理
$string = pack('A6', 'china');
var_dump($string); //輸出結果: string(6) "china ",最後一個字節是空格
echo ord($string[5]); //輸出結果: 32(ASCII碼中32對應的就是空格)

ASCII

附贈ASCII表一張(linux/unix下可使用man ascii查看)orm

h和H

$string = pack('H3', 281);
var_dump($string); //輸出結果: string(2) "("

for($i=0;$i<strlen($string);$i++) {
echo ord($string[$i]) . PHP_EOL;
}
//輸出結果: 40 16

h和H須要特殊說明一下,它們是將對應的參數看作十六進制字符而後打包。什麼意思呢?好比上面的281,打包前會將281轉換爲0x281,由於十六進制的一位對應二進制的四位,上面的0x281只有1.5個字節,後面會默認補0變成0x2810,0x28對應的十進制爲40((),0x10對應的十進制爲16(dle不可見字符),懂了吧?不懂能夠給我留言。。

c和C

$string = pack('c3', 67, 68, -1);
var_dump($string); //輸出:string(3) "CD�"

for($i=0;$i<strlen($string);$i++) {
echo ord($string[$i]) . PHP_EOL;
}
//輸出: 67 68 225

最後輸出本能應該以爲是67 68 -1
ord獲取的是字符的ASCII碼(範圍0-255),這時-1(0000 0001)對應的字符將以補碼的形式輸出也就是255(1111 1110 + 0000 0001 = 1111 1111)

整型相關

全部的整型類型使用方法徹底同樣,主要注意它們的位和字節序就能夠了,下面以L做爲例子展現

$string = pack('L', 123456789);
var_dump($string); //輸出:string(4) "�["

for($i=0;$i<strlen($string);$i++) {
echo ord($string[$i]) . PHP_EOL;
}
//輸出: 21 205 91 7

f和d

$string = pack('f', 12345.123);
var_dump($string);
//輸出:string(4) "~�@F"
var_dump(unpack('f', $string)); //這裏提早用到了unpack,後面會講解
//輸出:float(12345.123046875)

f和d是針對浮點數打包,至於爲何打包前是12345.123解包後是12345.123046875,這個和浮點數的儲存有關係,後面能夠單開一個文章講解一下IEEE標準

x、X、Z、@

$string = pack('x'); //打包一個nul字符串
echo ord($string); //輸出: 0

關於X(大寫X),試了N次,沒搞明白怎麼用,有清楚的童鞋能夠給我留言,多謝。

$string = pack('Z2', 'abc5'); //其實就是將從Z後面的數字位置開始,所有設置爲nul
var_dump($string); //輸出:string(2) "a"

for($i=0;$i<strlen($string);$i++) {
echo ord($string[$i]) . PHP_EOL;
}
//輸出: 97 0
$string = pack('@4'); //我理解爲填充N個nul
var_dump($string); //輸出: string(4) ""

for($i=0;$i<strlen($string);$i++) {
echo ord($string[$i]) . PHP_EOL;
}
//輸出: 0 0 0 0

unpack

array unpack ( string $format , string $data )

unpack的使用至關簡單,就是講pack打包的數據解包,打包的時候用的什麼參數,就用什麼參數解包,具體使用懶得說了,列幾個小例子

$string = pack('L4', 1, 2, 3, 4);
var_dump(unpack('L4', $string));
//輸出:
array(4) {
[1]=>
int(1)
[2]=>
int(2)
[3]=>
int(3)
[4]=>
int(4)
}

$string = pack('L4', 1, 2, 3, 4);
var_dump(unpack('Ll1/Ll2/Ll3/Ll4', $string)); //能夠指定key,用/分割
//輸出:
array(4) {
["l1"]=>
int(1)
["l2"]=>
int(2)
["l3"]=>
int(3)
["l4"]=>
int(4)
}

這兩個函數到底有啥用途

  • 數據通訊(經過二進制格式與其它語言通訊)
  • 數據加密(若是不告訴第三方你的打包方式,對方解包的難度就相對很大)
  • 節省空間(好比比較大的數字按字符串儲存會浪費不少空間,打包成二進制格式才須要4位<32位數字>)
  • 本身去想吧

開發了一個數獨小程序「惟一數獨」,歡迎掃描玩起來~

圖片描述

相關文章
相關標籤/搜索