深刻剖析PHP輸入流 php://input

PHP輸入流php://input在使用xml-rpc的時候,server端獲取client數據,主要是經過php輸入流input,而不是$_POST數組。因此,這裏主要探討php輸入流php://input對於php://input介紹,PHP官方手冊文檔有一段話對它進行了很明確地概述:php

php://input allows you to read raw POST data. It is a less memory intensive alternative to $HTTP_RAW_POST_DATA and does not need any special php.ini directives. php://input is not available with enctype=」multipart/form-data.html

翻譯過來,是這樣:數組

php://input能夠讀取沒有處理過的POST數據。相較於$HTTP_RAW_POST_DATA而言,它給內存帶來的壓力較小,而且不須要特殊的php.ini設置。php://input不能用於enctype=multipart/form-dataapp

咱們應該怎麼去理解這段概述呢?我把它劃分爲三部分,逐步去理解:less

讀取POST數據 不能用於multipart/form-data類型 php://input VS $HTTP_RAW_POST_DATA 讀取POST數據工具

PHPer們必定很熟悉$_POST這個內置變量。$_POST與php://input存在哪些關聯與區別呢?另外,客戶端向服務端交互數據,最經常使用的方法除了POST以外,還有GET。既然php://input做爲PHP輸入流,它能讀取GET數據嗎?這二個問題正是咱們這節須要探討的主要內容。post

經驗告訴咱們,從測試與觀察中總結,會是一個很湊效的方法。這裏,我寫了幾個腳原本幫助咱們測試。測試

@file 192.168.0.6:/phpinput_server.php 打印出接收到的數據
@file 192.168.0.8:/phpinput_post.php 模擬以POST方法提交表單數據
@file 192.168.0.8:/phpinput_xmlrpc.php 模擬以POST方法發出xmlrpc請求.
@file 192.168.0.8:/phpinput_get.php 模擬以GET方法提交表單表數

phpinput_server.php與phpinput_post.phpurl

//@file phpinput_server.php$raw_post_data = file_get_contents('php://input', 'r');echo "-------\$_POST------------------\n";echo var_dump($_POST) . "\n";echo "-------php://input-------------\n";echo $raw_post_data . "\n";
//@file phpinput_post.php
$http_entity_body = 'n=' . urldecode('perfgeeks') . '&p=' . urldecode('7788');
$http_entity_type = 'application/x-www-form-urlencoded';
$http_entity_length = strlen($http_entity_body);
$host = '192.168.0.6';
$port = 80;
$path = '/phpinput_server.php';
$fp = fsockopen($host, $port, $error_no, $error_desc, 30);
if ($fp) {
  fputs($fp, "POST {$path} HTTP/1.1\r\n");
  fputs($fp, "Host: {$host}\r\n");
  fputs($fp, "Content-Type: {$http_entity_type}\r\n");
  fputs($fp, "Content-Length: {$http_entity_length}\r\n");
  fputs($fp, "Connection: close\r\n\r\n");
  fputs($fp, $http_entity_body . "\r\n\r\n");

  while (!feof($fp)) {
    $d .= fgets($fp, 4096);
  }
  fclose($fp);
  echo $d;
}

咱們能夠經過使用工具ngrep抓取http請求包(由於咱們須要探知的是php://input,因此咱們這裏只抓取http Request數據包)。咱們來執行測試腳本phpinput_post.php.net

@php /phpinput_post.php
HTTP/1.1 200 OK
Date: Thu, 08 Apr 2010 03:23:36 GMT
Server: Apache/2.2.3 (CentOS)
X-Powered-By: PHP/5.1.6
Content-Length: 160
Connection: close
Content-Type: text/html; charset=UTF-8
-------$_POST------------------
array(2) {
  ["n"]=> string(9) "perfgeeks"
  ["p"]=> string(4) "7788"
}
-------php://input-------------
n=perfgeeks&p=7788

經過ngrep抓到的http請求包以下:

T 192.168.0.8:57846 -> 192.168.0.6:80 [AP]
  POST /phpinput_server.php HTTP/1.1..
  Host: 192.168.0.6..Content-Type: application/x-www-form-urlencoded..Co
  ntent-Length: 18..Connection: close....n=perfgeeks&p=7788....

仔細觀察,咱們不難發現:

$_POST數據,php://input 數據與httpd entity body數據是「一致」的。 http請求中的Content-Type是application/x-www-form-urlencoded ,它表示http請求body中的數據是使用http的post方法提交的表單數據,而且進行了urlencode()處理。 (注:注意加粗部份內容,下文再也不提示)。

咱們再來看看腳本phpinput_xmlrpc.php的原文件內容,它模擬了一個POST方法提交的xml-rpc請求。

//@file phpinput_xmlrpc.php
$http_entity_body = "\n\n   jt_userinfo\n";
$http_entity_type = 'text/html';
$http_entity_length = strlen($http_entity_body);
$host = '192.168.0.6';
$port = 80;
$path = '/phpinput_server.php';
$fp = fsockopen($host, $port, $error_no, $error_desc, 30);
if ($fp) {
  fputs($fp, "POST {$path} HTTP/1.1\r\n");
  fputs($fp, "Host: {$host}\r\n");
  fputs($fp, "Content-Type: {$http_entity_type}\r\n");
  fputs($fp, "Content-Length: {$http_entity_length}\r\n");
  fputs($fp, "Connection: close\r\n\r\n");
  fputs($fp, $http_entity_body . "\r\n\r\n");
  while (!feof($fp)) {
    $d .= fgets($fp, 4096);
  }

  fclose($fp);
  echo $d;
}

一樣地,讓咱們來執行這個測試腳本:

@php /phpinput_xmlrcp.php
HTTP/1.1 200 OK
Date: Thu, 08 Apr 2010 03:47:18 GMT
Server: Apache/2.2.3 (CentOS)
X-Powered-By: PHP/5.1.6
Content-Length: 154
Connection: close
Content-Type: text/html; charset=UTF-8

-------$_POST------------------
array(0) {
}

-------php://input-------------
<?xml version="1.0">
<methodcall>
   <name>jt_userinfo</name>
</methodcall>

執行這個腳本的時候,咱們經過ngrep抓取的http請求數據包以下:

T 192.168.0.8:45570 -> 192.168.0.6:80 [AP]
  POST /phpinput_server.php HTTP/1.1..
  Host: 192.168.0.6..Content-Type: text/html..Content-Length: 75..Connec
  tion: close....<?xml version="1.0">.<methodcall>.   <name>jt_userinfo<
  /name>.</methodcall>....

一樣,我樣也能夠很容易地發現:

http請求中的Content-Type是text/xml。它表示http請求中的body數據是xml數據格式。 服務端$_POST打印出來的是一個空數組,即與http entity body不一致了。這跟上個例子不同了,這裏的Content-Type是text/xml,而不是application/x-www-form-urlencoded 而php://input數據仍是跟http entity body數據一致。也就是php://input數據和$_POST數據不一致了。 咱們再來看看經過GET方法提交表單數據的狀況,php://input能不能讀取到GET方法的表單數據?在這裏,咱們稍加改動一下phpinput_server.php文件,將$_POST改爲$_GET。

//@file phpinput_server.php
$raw_post_data = file_get_contents('php://input', 'r');
echo "-------\$_GET------------------\n";
echo var_dump($_GET) . "\n";
echo "-------php://input-------------\n";
echo $raw_post_data . "\n";
//@file phpinput_get.php
$query_path = 'n=' . urldecode('perfgeeks') . '&p=' . urldecode('7788');
$host = '192.168.0.6';
$port = 80;
$path = '/phpinput_server.php';
$d = '';
$fp = fsockopen($host, $port, $error_no, $error_desc, 30);
if ($fp) {
  fputs($fp, "GET {$path}?{$query_path} HTTP/1.1\r\n");
  fputs($fp, "Host: {$host}\r\n");
  fputs($fp, "Connection: close\r\n\r\n");

  while (!feof($fp)) {
    $d .= fgets($fp, 4096);
  }
  fclose($fp);
  echo $d;
 }

一樣,咱們執行下一phpinput_get.php測試腳本,它模擬了一個一般狀況下的GET方法提交表單數據。

@php /phpinput_get.php
HTTP/1.1 200 OK
Date: Thu, 08 Apr 2010 07:38:15 GMT
Server: Apache/2.2.3 (CentOS)
X-Powered-By: PHP/5.1.6
Content-Length: 141
Connection: close
Content-Type: text/html; charset=UTF-8

-------$_GET------------------
array(2) {
  ["n"]=>
  string(9) "perfgeeks"
  ["p"]=>
  string(4) "7788"
}

-------php://input-------------

在這個時候,使用ngrep工具,捕獲的相應的http請求數據包以下:

T 192.168.0.8:36775 -> 192.168.0.6:80 [AP]
  GET /phpinput_server.php?n=perfgeeks&p=7788 HTTP/1.1..
  Host: 192.168.0.6..Connection: close....

比較POST方法提交的http請求,一般GET方法提交的請求中,entity body爲空。同時,不會指定Content-Type和Content-Length。可是,若是強硬數據http entity body,並指明正確地Content-Type和Content-Length,那麼php://input還但是讀取獲得http entity body數據,但不是$_GET數據。

所根據,上面幾個探測,咱們能夠做出如下總結:

Content-Type取值爲application/x-www-form-urlencoded時,php會將http請求body相應數據會填入到數組$_POST,填入到$_POST數組中的數據是進行urldecode()解析的結果。(其實,除了該Content-Type,還有multipart/form-data表示數據是表單數據,稍後咱們介紹) php://input數據,只要Content-Type不爲multipart/form-data(該條件限制稍後會介紹)。那麼php://input數據與http entity body部分數據是一致的。該部分相一致的數據的長度由Content-Length指定。 僅當Content-Type爲application/x-www-form-urlencoded且提交方法是POST方法時,$_POST數據與php://input數據纔是」一致」(打上引號,表示它們格式不一致,內容一致)的。其它狀況,它們都不一致。 php://input讀取不到$_GET數據。是由於$_GET數據做爲query_path寫在http請求頭部(header)的PATH字段,而不是寫在http請求的body部分。 這也幫助咱們理解了,爲何xml_rpc服務端讀取數據都是經過file_get_contents(‘php://input’, ‘r’)。而不是從$_POST中讀取,正是由於xml_rpc數據規格是xml,它的Content-Type是text/xml。

php://input碰到了multipart/form-data

上傳文件的時候,表單的寫法是這樣的:

<form enctype="multipart/form-data" action="phpinput_server.php"method="POST" >
    <input type="text" name="n"  />
    <input type="file" name="f" />
    <input type="submit" value="upload now" />
</form>

那麼,enctype=multipart/form-data這裏的意義,就是將該次http請求頭部(head)中的Content-Type設置爲multipart/form-data。請查閱RFC1867對它的描述。multipart/form-data也表示以POST方法提交表單數據,它還伴隨了文件上傳,因此會跟application/x-www-form-urlencoded數據格式不同。它會以一更種更合理的,更高效的數據格式傳遞給服務端。咱們提交該表單數據,而且打印出響應結果,以下:

-------$_POST------------------
array(1) { ["n"]=> string(9) "perfgeeks" }
-------php://input-------------

同時,咱們經過ngrep抓取的相應的http請求數據包以下:

########
T 192.168.0.8:3981 -> 192.168.0.6:80 [AP]
  POST /phpinput_server.php HTTP/1.1..Host: 192.168.0.6..Connection: kee
  p-alive..User-Agent: Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US) A
  ppleWebKit/533.2 (KHTML, like Gecko) Chrome/5.0.342.3 Safari/533.2..Re
  ferer: http://192.168.0.6/phpinput_server.php..Content-Length: 306..Ca
  che-Control: max-age=0..Origin: http://192.168.0.6..Content-Type: mult
  ipart/form-data; boundary=----WebKitFormBoundarybLQwkp4opIEZn1fA..Acce
  pt: application/xml,application/xhtml+xml,text/html;q=0.9,text/plain;q
  =0.8,image/png,*/*;q=0.5..Accept-Encoding: gzip,deflate,sdch..Accept-L
  anguage: zh-CN,zh;q=0.8..Accept-Charset: GBK,utf-8;q=0.7,*;q=0.3..Cook
  ie: SESS3b0e658f87cf58240de13ab43a399df6=lju6o5bg8u04lv1ojugm2ccic6...
  .
##
T 192.168.0.8:3981 -> 192.168.0.6:80 [AP]
  ------WebKitFormBoundarybLQwkp4opIEZn1fA..Content-Disposition: form-da
  ta; name="n"....perfgeeks..------WebKitFormBoundarybLQwkp4opIEZn1fA..C
  ontent-Disposition: form-data; name="f"; filename="test.txt"..Content-
  Type: text/plain....i am file..multipart/form-data..------WebKitFormBo
  undarybLQwkp4opIEZn1fA--..
##

從響應輸出來比對,$_POST數據跟請求提交數據相符,即$_POST = array(‘n’ => ‘perfgeeks’)。這也跟http請求body中的數據相呼應,同時說明PHP把相應的數據填入$_POST全局變量。而php://input輸出爲空,沒有輸出任何東西,儘管http請求數據包中body不爲空。這表示,當Content-Type爲multipart/form-data的時候,即使http請求body中存在數據,php://input也爲空,PHP此時,不會把數據填入php://input流。因此,能夠肯定: php://input不能用於讀取enctype=multipart/form-data數據。

咱們再比較此次經過ngrep抓取的http請求數據包,咱們會發現,最大不一樣的一點是Content-Type後面跟了boundary定義了數據的分界符,bounday是隨機生成的。另一個大不同的,就是http entity body中的數據組織結構不同了。

上一節,咱們概述了,當Content-Type爲application/x-www-form-urlencoded時,php://input和$_POST數據是「一致」的,爲其它Content-Type的時候,php://input和$_POST數據數據是不一致的。由於只有在Content-Type爲application/x-www-form-urlencoded或者爲multipart/form-data的時候,PHP纔會將http請求數據包中的body相應部分數據填入$_POST全局變量中,其它狀況PHP都忽略。而php://input除了在數據類型爲multipart/form-data以外爲空外,其它狀況均可能不爲空。經過這一節,咱們更加明白了php://input與$_POST的區別與聯繫。因此,再次確認,php://input沒法讀取enctype=multipart/form-data數據,當php://input遇到它時,永遠爲空,即使http entity body有數據。

php://input VS $http_raw_post_data

相信你們對php://input已經有必定深度地瞭解了。那麼$http_raw_post_data是什麼呢?$http_raw_post_data是PHP內置的一個全局變量。它用於,PHP在沒法識別的Content-Type的狀況下,將POST過來的數據原樣地填入變量$http_raw_post_data。它一樣沒法讀取Content-Type爲multipart/form-data的POST數據。須要設置php.ini中的always_populate_raw_post_data值爲On,PHP纔會總把POST數據填入變量$http_raw_post_data。

把腳本phpinput_server.php改變一下,能夠驗證上述內容:

$raw_post_data = file_get_contents('php://input', 'r');
$rtn = ($raw_post_data == $HTTP_RAW_POST_DATA) ? 1 : 0;
echo $rtn;

執行測試腳本:

@php phpinput_post.php
@php phpinput_get.php
@php phpinput_xmlrpc.php

得出的結果輸出都是同樣的,即都爲1,表示php://input和$HTTP_RAW_POST_DATA是相同的。至於對內存的壓力,咱們這裏就不作細緻地測試了。有興趣的,能夠經過xhprof進行測試和觀察。

以此,咱們這節能夠總結以下:

php://input 能夠讀取http entity body中指定長度的值,由Content-Length指定長度,不論是POST方式或者GET方法提交過來的數據。可是,通常GET方法提交數據時,http request entity body部分都爲空。 php://input 與$HTTP_RAW_POST_DATA讀取的數據是同樣的,都只讀取Content-Type不爲multipart/form-data的數據。 小結

Coentent-Type僅在取值爲application/x-www-data-urlencoded和multipart/form-data兩種狀況下,PHP纔會將http請求數據包中相應的數據填入全局變量$_POST PHP不能識別的Content-Type類型的時候,會將http請求包中相應的數據填入變量$HTTP_RAW_POST_DATA 只有Coentent-Type不爲multipart/form-data的時候,PHP不會將http請求數據包中的相應數據填入php://input,不然其它狀況都會。填入的長度,由Coentent-Length指定。 只有Content-Type爲application/x-www-data-urlencoded時,php://input數據纔跟$_POST數據相一致。 php://input數據老是跟$HTTP_RAW_POST_DATA相同,可是php://input比$HTTP_RAW_POST_DATA更湊效,且不須要特殊設置php.ini PHP會將PATH字段的query_path部分,填入全局變量$_GET。一般狀況下,GET方法提交的http請求,body爲空。

原文地址:http://www.nowamagic.net/academy/detail/12220520

相關文章
相關標籤/搜索