PHP trick（代碼審計關注點）

時間 2019-12-09

標籤 php trick 代碼審計關注欄目 PHP 简体版

原文原文鏈接

隨着代碼安全的普及，愈來愈多的開發人員知道了如何防護sqli、xss等與語言無關的漏洞，可是對於和開發語言自己相關的一些漏洞和缺陷卻知之甚少，因而這些點也就是咱們在Code audit的時候的重點關注點。本文旨在總結一些在PHP代碼中常常形成問題的點，也是咱們在審計的時候的關注重點。（PS：本文也只是簡單的列出問題，至於形成問題的底層緣由未作詳細解釋，有興趣的看官能夠自行GOOGLE或者看看底層C代碼。知其然，且知其因此然）php

本文如有寫錯的地方，還請各位大佬斧正 :)html

TODO: 繼續豐富並增長各個點的實際漏洞事例linux

file_put_contents、copy、file_get_contents等讀取寫入操做與unlink、file_exists等刪除判斷文件函數之間對於路徑處理的差別致使的刪除繞過

例如以下代碼sql

<?php $filename = __DIR__ . '/tmp/' . $user['name']; $data = $user['info']; file_put_contents($filename, $data); if (file_exists($filename)) { unlink($filename); } ?>

這裏引用小密圈中P牛的解讀windows

查看php源碼，其實咱們能發現，php讀取、寫入文件，都會調用php_stream_open_wrapper_ex來打開流，而判斷文件存在、重命名、刪除文件等操做則無需打開文件流。數組

咱們跟一跟php_stream_open_wrapper_ex就會發現，其實最後會使用tsrm_realpath函數來將filename給標準化成一個絕對路徑。而文件刪除等操做則不會，這就是兩者的區別。安全

因此，若是咱們傳入的是文件名中包含一個不存在的路徑，寫入的時候由於會處理掉「../」等相對路徑，因此不會出錯；判斷、刪除的時候由於不會處理，因此就會出現「No such file or directory」的錯誤。app

因而乎linux能夠經過xxxxx/../test.php、test.php/. windows能夠經過test.php:test test.ph<來繞過文件刪除curl

此外發現還可使用僞協議php://filter/resource=1.php在file_ge_contents、copy等中讀取文件內容，卻能夠繞過文件刪除xss

extract()、parse_str() 等變量覆蓋

extract函數從數組導入變量（如\$_GET、 \$_POST）,將數組的鍵名做爲變量的值。而parse_str函數則是從相似name=Bill&age=60的格式字符串解析變量.若是在使用第一個函數沒有設置EXTR_SKIP或者EXTR_PREFIX_SAME等處理變量衝突的參數時、第二個函數沒有使用數組接受變量時將會致使變量覆蓋的問題

intval()整數溢出、向下取整和整形判斷的問題

32位系統最大的帶符號範圍爲-2147483648 到 2147483647，64位最大的是 9223372036854775807

所以，在32位系統上 intval('1000000000000') 會返回 2147483647

此外intval(10.99999)會返回10，intval和int等取整都是'截斷'取整，並非四捨五入
intval函數進去取整時，是直到趕上數字或者正負號纔開始進行轉換，以後在遇到非數字或者結束符號（\0）時結束轉換

浮點數精度問題致使的大小比較問題

當小數小於10^-16後，PHP對於小數就大小不分了

var_dump(1.000000000000000 == 1) >> TRUE

var_dump(1.0000000000000001 == 1) >> TRUE

is_numeric()與intval()特性差別

is_numeric函數在判斷是不是數字時會忽略字符串開頭的' '、'\t'、'\n'、'\r'、'\v'、'\f'。

而'.'能夠出如今任意位置，E、e能出如今參數中間，仍能夠被判斷爲數字。也就是說is_numeric("\r\n\t 0.1e2") >> TRUE

intval()函數會忽略'' '\n'、'\r'、'\t'、'\v'、'\0' ，也就是說intval("\r\n\t 12") >> 12

strcmp()數組比較繞過

int strcmp ( string $ str1 , string \$str2 )

參數 str1第一個字符串。str2第二個字符串。若是 str1 小於 str2 返回 < 0；

若是 str1 大於 str2 返回 > 0；若是二者相等，返回 0。

可是若是傳入的兩個變量是數組的話，函數會報錯返回NULL，若是隻是用strcmp()==0來判斷的話就能夠繞過

sha1()、md5() 函數傳入數組比較繞過

sha1（） MD5（）函數默認接收的參數是字符串類型，可是若是若是傳入的參數是數組的話，函數就會報錯返回NULL。相似sha1(\$_GET['name']) === sha1(\$_GET['password’])的比較就能夠繞過

弱類型==比較繞過

這方面問題普及的不少，不做過多的解釋

md5('240610708'); // 0e462097431906509019562988736854

md5('QNKCDZO'); // 0e830400451993494058024219903391

md5('240610708') == md5('QNKCDZO')

md5('aabg7XSs') == md5('aabC9RqS')

sha1('aaroZmOk') == sha1('aaK1STfY')

sha1('aaO8zKZF') == sha1('aa3OFF9m')
'0010e2' == '1e3'

'0x1234Ab' == '1193131'

'0xABCdef' == ' 0xABCdef’
當轉換爲boolean時，如下只被認爲是FALSE：FALSE、0、0.0、「」、「0」、array()、NULL
PHP 7 之前的版本里，若是向八進制數傳遞了一個非法數字（即 8 或 9），則後面其他數字會被忽略。var_dump(0123)=var_dump(01239)=83

PHP 7 之後，會產生 Parse Error。
字符串轉換爲數值時，若字符串開頭有數字，則轉爲數字並省略後面的非數字字符。若一開頭沒有數字則轉換爲0

\$foo = 1 + "bob-1.3e3"; // $foo is integer (1)

\$foo = 1 + "bob3"; // $foo is integer (1)

\$foo = 1 + "10 Small Pigs"; // $foo is integer (11)
'' == 0 == false

'123' == 123

'abc' == 0

'123a' == 123

'0x01' == 1

'0e123456789' == ‘0e987654321'

[false] == [0] == [NULL] == [‘']

NULL == false == 0» true == 1

eregi()匹配繞過

eregi（）默認接收字符串參數，若是傳入數組，函數會報錯並返回NULL。同時還能夠%00 截斷進行繞過

PHP變量名不能帶有點[.] 和空格，不然在會被轉化爲下劃線[_]

parse_str("na.me=admin&pass wd=123",$test); var_dump($test); array(2) { ["na_me"]=> string(5) "admin" ["pass_wd"]=> string(3) "123" }

in_arrary()函數默認進行鬆散比較（進行類型轉換）

in_arrary(「1asd」,arrart(1,2,3,4)) => true in_arrary(「1asd」,arrart(1,2,3,4),TRUE) => false \\(須要設置strict參數爲true纔會進行嚴格比較，進行類型檢測)

htmlspecialchars()函數默認只轉義雙引號不轉義單引號，若是都轉義的話須要添加上參數ENT_QUOTES

在php四、php<5.2.1中，變量的key值不受magic_quotes_gpc影響

sprintf()格式化漏洞（能夠吃掉轉義後的單引號）

printf（）和sprintf（）函數中能夠經過使用%接一個字符來進行padding功能

例如%10s 字符串會默認在左側填充空格至長度爲10，還能夠 %010s 會使用字符0進行填充，可是若是咱們想要使用別的字符進行填充，須要使用 ‘ 單引號進行標識，例如 %’#10s 這個就是使用#進行填充（百分號不只會吃掉’單引號，還會吃掉\ 斜槓）

同時sprintf（）可使用指定參數位置的寫法

](http://or48znikk.bkt.clouddn.com/dmsj/dmsj17.png)

%後面的數字表明第幾個參數，$後表明格式化類型

因而當咱們輸入的特殊字符被放到引號中進行轉義時，可是又使用了sprintf函數進行拼接時

例如%1$’%s’ 中的 ‘%被當成使用%進行padding，致使後一個’逃逸了

還有一種狀況就是’被轉義成了\’,例如輸入%’ and 1=1#進入，存在SQL過濾，’被轉成了\’

因而sql語句變成了 select * from user where username = '%\' and 1=1#’;

若是這個語句被使用sprintf函數進行了拼接，%後的\被吃掉了，致使了’逃逸

<?php $sql = "select * from user where username = '%\' and 1=1#';"; $args = "admin"; echo sprintf( $sql, $args ) ; //result: select * from user where username = '' and 1=1#' ?>

不過這樣容易遇到 PHP Warning: sprintf(): Too few arguments的報錯

這個時候咱們可使用%1$來吃掉轉移添加的\

<?php $sql = "select * from user where username = '%1$\' and 1=1#' and password='%s';"; $args = "admin"; echo sprintf( $sql, $args) ; //result: select * from user where username = '' and 1=1#' and password='admin'; ?>

php中and條件判斷不是全爲TRUE才返回TRUE，而是當第一個爲TRUE就直接返回TRUE，直接跳過第二個條件判斷

例如is_numeric($a) and is_numeric($b) 程序本意是要a、b都爲數字纔會繼續，可是當$a爲數字and即返回TRUE，即 true and false >> true

parse_url與libcurl對與url的解析差別可能致使ssrf

當url中有多個@符號時，parse_url中獲取的host是最後一個@符號後面的host，而libcurl則是獲取的第一個@符號以後的。所以當代碼對http://user@eval.com:80@baidu.com 進行解析時，PHP獲取的host是baidu.com是容許訪問的域名，而最後調用libcurl進行請求時則是請求的eval.com域名，能夠形成ssrf繞過
此外對於https://evil@baidu.com這樣的域名進行解析時,php獲取的host是evil@baidu.com，可是libcurl獲取的host倒是evil.com

url標準的靈活性致使繞過filter_var與parse_url進行ssrf

filter_var()函數對於http://evil.com;google.com 會返回false也就是認爲url格式錯誤，可是對於0://evil.com:80;google.com:80/ 、0://evil.com:80,google.com:80/、0://evil.com:80\google.com:80/卻返回true。

經過file_get_contents獲取網頁內容並返回到客戶端有可能形成xss

例如以下代碼

if(filter_var($argv[1], FILTER_VALIDATE_URL)) { // parse URL $r = parse_url($argv[1]); print_r($r); // check if host ends with google.com if(preg_match('/baidu\.com$/', $r['host'])) { // get page from URL $a = file_get_contents($argv[1]); echo($a); } else { echo "Error: Host not allowed"; } } else { echo "Error: Invalid URL"; }