PHP編程中10個最多見的錯誤

PHP是一種很是流行的開源服務器端腳本語言,你在萬維網看到的大多數網站都是使用php開發的。本篇經將爲你們介紹PHP開發中10個最多見的問題,但願可以對朋友有所幫助。php

 錯誤1:foreach循環後留下懸掛指針

  在foreach循環中,若是咱們須要更改迭代的元素或是爲了提升效率,運用引用是一個好辦法:html

1
2
3
4
5
$arr = array (1, 2, 3, 4);
foreach ( $arr as & $value ) {
    $value = $value * 2;
}
// $arr is now array(2, 4, 6, 8)

  這裏有個問題不少人會迷糊。循環結束後,$value並未銷燬,$value實際上是數組中最後一個元素的引用,這樣在後續對$value的使用中,若是不知道這一點,會引起一些莫名奇妙的錯誤:)看看下面這段代碼:java

1
2
3
4
5
6
7
8
$array = [1, 2, 3];
echo implode( ',' , $array ), "\n" ;
 
foreach ( $array as & $value ) {}     // by reference
echo implode( ',' , $array ), "\n" ;
 
foreach ( $array as $value ) {}     // by value (i.e., copy)
echo implode( ',' , $array ), "\n" ;

  上面代碼的運行結果以下:mysql

1
2
3
1,2,3
1,2,3
1,2,2

  你猜對了嗎?爲何是這個結果呢?ajax

  咱們來分析下。第一個循環事後,$value是數組中最後一個元素的引用。第二個循環開始:sql

  • 第一步:複製$arr[0]到$value(注意此時$value是$arr[2]的引用),這時數組變成[1,2,1]
  • 第二步:複製$arr[1]到$value,這時數組變成[1,2,2]
  • 第三步:複製$arr[2]到$value,這時數組變成[1,2,2]

  綜上,最終結果就是1,2,2數據庫

  避免這種錯誤最好的辦法就是在循環後當即用unset函數銷燬變量:編程

1
2
3
4
5
$arr = array (1, 2, 3, 4);
foreach ( $arr as & $value ) {
    $value = $value * 2;
}
unset( $value );   // $value no longer references $arr[3]

 錯誤2:對isset()函數行爲的錯誤理解

  對於isset()函數,變量不存在時會返回false,變量值爲null時也會返回false。這種行爲很容易把人弄迷糊。。。看下面的代碼:json

1
2
3
4
$data = fetchRecordFromStorage( $storage , $identifier );
if (!isset( $data [ 'keyShouldBeSet' ]) {
    // do something here if 'keyShouldBeSet' is not set
}

  寫這段代碼的人本意多是若是$data['keyShouldBeSet']未設置,則執行對應邏輯。但問題在於即便$data['keyShouldBeSet']已設置,但設置的值爲null,仍是會執行對應的邏輯,這就不符合代碼的本意了。數組

  下面是另一個例子:

1
2
3
4
5
6
7
8
9
if ( $_POST [ 'active' ]) {
    $postData = extractSomething( $_POST );
}
 
// ...
 
if (!isset( $postData )) {
    echo 'post not active' ;
}

  上面的代碼假設$_POST['active']爲真,那麼$postData應該被設置,所以isset($postData)會返回true。反之,上 面代碼假設isset($postData)返回false的惟一途徑就是$_POST['active']也返回false。

  真是這樣嗎?固然不是!

  即便$_POST['active']返回true,$postData也有可能被設置爲null,這時isset($postData)就會返回false。這就不符合代碼的本意了。

  若是上面代碼的本意僅是檢測$_POST['active']是否爲真,下面這樣實現會更好:

1
2
3
4
5
6
7
8
9
if ( $_POST [ 'active' ]) {
    $postData = extractSomething( $_POST );
}
 
// ...
 
if ( $_POST [ 'active' ]) {
    echo 'post not active' ;
}

  判斷一個變量是否真正被設置(區分未設置和設置值爲null),array_key_exists()函數或許更好。重構上面的第一個例子,以下:

1
2
3
4
$data = fetchRecordFromStorage( $storage , $identifier );
if (! array_key_exists ( 'keyShouldBeSet' , $data )) {
    // do this if 'keyShouldBeSet' isn't set
}

  另外,結合get_defined_vars()函數,咱們能夠更加可靠的檢測變量在當前做用域內是否被設置:

1
2
3
if ( array_key_exists ( 'varShouldBeSet' , get_defined_vars())) {
    // variable $varShouldBeSet exists in current scope
}

 錯誤3:混淆返回值和返回引用

  考慮下面的代碼:

1
2
3
4
5
6
7
8
9
10
11
12
13
class Config
{
    private $values = [];
 
    public function getValues() {
        return $this ->values;
    }
}
 
$config = new Config();
 
$config ->getValues()[ 'test' ] = 'test' ;
echo $config ->getValues()[ 'test' ];

  運行上面的代碼,將會輸出下面的內容:

1
PHP Notice:  Undefined index: test in /path/to/my/script.php on line 21

  問題出在哪呢?問題就在於上面的代碼混淆了返回值和返回引用。在PHP中,除非你顯示的指定返回引用,不然對於數組PHP是值返回,也就是數組的拷貝。所以上面代碼對返回數組賦值,實際是對拷貝數組進行賦值,非原數組賦值。

1
2
3
4
5
6
7
// getValues() returns a COPY of the $values array, so this adds a 'test' element
// to a COPY of the $values array, but not to the $values array itself.
$config ->getValues()[ 'test' ] = 'test' ;
 
// getValues() again returns ANOTHER COPY of the $values array, and THIS copy doesn't
// contain a 'test' element (which is why we get the "undefined index" message).
echo $config ->getValues()[ 'test' ];

  下面是一種可能的解決辦法,輸出拷貝的數組,而不是原數組:

1
2
3
$vals = $config ->getValues();
$vals [ 'test' ] = 'test' ;
echo $vals [ 'test' ];

  若是你就是想要改變原數組,也就是要反回數組引用,那應該如何處理呢?辦法就是顯示指定返回引用便可:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
class Config
{
    private $values = [];
 
    // return a REFERENCE to the actual $values array
    public function &getValues() {
        return $this ->values;
    }
}
 
$config = new Config();
 
$config ->getValues()[ 'test' ] = 'test' ;
echo $config ->getValues()[ 'test' ];

  通過改造後,上面代碼將會像你指望那樣會輸出test。

  咱們再來看一個例子會讓你更迷糊的例子:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
class Config
{
    private $values ;
 
    // using ArrayObject rather than array
    public function __construct() {
        $this ->values = new ArrayObject();
    }
 
    public function getValues() {
        return $this ->values;
    }
}
 
$config = new Config();
 
$config ->getValues()[ 'test' ] = 'test' ;
echo $config ->getValues()[ 'test' ];

  若是你想的是會和上面同樣輸出「 Undefined index」錯誤,那你就錯了。代碼會正常輸出「test」。緣由在於PHP對於對象默認就是按引用返回的,而不是按值返回。

  綜上所述,咱們在使用函數返回值時,要弄清楚是值返回仍是引用返回。PHP中對於對象,默認是引用返回,數組和內置基本類型默認均按值返回。這個要與其它語言區別開來(不少語言對於數組是引用傳遞)。

  像其它語言,好比java或C#,利用getter或setter來訪問或設置類屬性是一種更好的方案,固然PHP默認不支持,須要本身實現:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
class Config
{
    private $values = [];
 
    public function setValue( $key , $value ) {
        $this ->values[ $key ] = $value ;
    }
 
    public function getValue( $key ) {
        return $this ->values[ $key ];
    }
}
 
$config = new Config();
 
$config ->setValue( 'testKey' , 'testValue' );
echo $config ->getValue( 'testKey' );     // echos 'testValue'

  上面的代碼給調用者能夠訪問或設置數組中的任意值而不用給與數組public訪問權限。感受怎麼樣:)

 錯誤4:在循環中執行sql查詢

  在PHP編程中發現相似下面的代碼並很多見:

1
2
3
4
5
$models = [];
 
foreach ( $inputValues as $inputValue ) {
    $models [] = $valueRepository ->findByValue( $inputValue );
}

  固然上面的代碼是沒有什麼錯誤的。問題在於咱們在迭代過程當中$valueRepository->findByValue()可能每次都執行了sql查詢:

1
$result = $connection ->query( "SELECT `x`,`y` FROM `values` WHERE `value`=" . $inputValue );

  若是迭代了10000次,那麼你就分別執行了10000次sql查詢。若是這樣的腳本在多線程程序中被調用,那極可能你的系統就掛了。。。

  在編寫代碼過程當中,你應該要清楚何時應該執行sql查詢,儘量一次sql查詢取出全部數據。

  有一種業務場景,你極可能會犯上述錯誤。假設一個表單提交了一系列值(假設爲IDs),而後爲了取出全部ID對應的數據,代碼將遍歷IDs,分別對每一個ID執行sql查詢,代碼以下所示:

1
2
3
4
5
$data = [];
foreach ( $ids as $id ) {
    $result = $connection ->query( "SELECT `x`, `y` FROM `values` WHERE `id` = " . $id );
    $data [] = $result ->fetch_row();
}

  但一樣的目的能夠在一個sql中更加高效的完成,代碼以下:

1
2
3
4
5
6
7
$data = [];
if ( count ( $ids )) {
    $result = $connection ->query( "SELECT `x`, `y` FROM `values` WHERE `id` IN (" . implode( ',' , $ids ));
    while ( $row = $result ->fetch_row()) {
        $data [] = $row ;
    }
}

 錯誤5:內存使用低效和錯覺

  一次sql查詢獲取多條記錄比每次查詢獲取一條記錄效率確定要高,但若是你使用的是php中的mysql擴展,那麼一次獲取多條記錄就極可能會致使內存溢出。

  咱們能夠寫代碼來實驗下(測試環境: 512MB RAM、MySQL、php-cli):

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
// connect to mysql
$connection = new mysqli( 'localhost' , 'username' , 'password' , 'database' );
 
// create table of 400 columns
$query = 'CREATE TABLE `test`(`id` INT NOT NULL PRIMARY KEY AUTO_INCREMENT' ;
for ( $col = 0; $col < 400; $col ++) {
    $query .= ", `col$col` CHAR(10) NOT NULL" ;
}
$query .= ');' ;
$connection ->query( $query );
 
// write 2 million rows
for ( $row = 0; $row < 2000000; $row ++) {
    $query = "INSERT INTO `test` VALUES ($row" ;
    for ( $col = 0; $col < 400; $col ++) {
        $query .= ', ' . mt_rand(1000000000, 9999999999);
    }
    $query .= ')' ;
    $connection ->query( $query );
}

  如今來看看資源消耗:

1
2
3
4
5
6
7
8
9
// connect to mysql
$connection = new mysqli( 'localhost' , 'username' , 'password' , 'database' );
echo "Before: " . memory_get_peak_usage() . "\n" ;
 
$res = $connection ->query( 'SELECT `x`,`y` FROM `test` LIMIT 1' );
echo "Limit 1: " . memory_get_peak_usage() . "\n" ;
 
$res = $connection ->query( 'SELECT `x`,`y` FROM `test` LIMIT 10000' );
echo "Limit 10000: " . memory_get_peak_usage() . "\n" ;

  輸出結果以下:

1
2
3
Before: 224704
Limit 1: 224704
Limit 10000: 224704

  根據內存使用量來看,貌似一切正常。爲了更加肯定,試着一次獲取100000條記錄,結果程序獲得以下輸出:

1
2
PHP Warning:  mysqli::query(): (HY000/2013):
              Lost connection to MySQL server during query in /root/test.php on line 11

  這是怎麼回事呢?

  問題出在php的mysql模塊的工做方式,mysql模塊實際上就是libmysqlclient的一個代理。在查詢獲取多條記錄的同時,這些記錄會直接 保存在內存中。因爲這塊內存不屬於php的內存模塊所管理,因此咱們調用memory_get_peak_usage()函數所得到的值並不是真實使用內存 值,因而便出現了上面的問題。

  咱們可使用mysqlnd來代替mysql,mysqlnd編譯爲php自身擴展,其內存使用由php內存管理模塊所控制。若是咱們用mysqlnd來實現上面的代碼,則會更加真實的反應內存使用狀況:

1
2
3
Before: 232048
Limit 1: 324952
Limit 10000: 32572912

  更加糟糕的是,根據php的官方文檔,mysql擴展存儲查詢數據使用的內存是mysqlnd的兩倍,所以原來的代碼使用的內存是上面顯示的兩倍左右。

  爲了不此類問題,能夠考慮分幾回完成查詢,減少單次查詢數據量:

1
2
3
4
5
6
7
8
$totalNumberToFetch = 10000;
$portionSize = 100;
 
for ( $i = 0; $i <= ceil ( $totalNumberToFetch / $portionSize ); $i ++) {
    $limitFrom = $portionSize * $i ;
    $res = $connection ->query(
                          "SELECT `x`,`y` FROM `test` LIMIT $limitFrom, $portionSize" );
}

  聯繫上面提到的錯誤4能夠看出,在實際的編碼過程當中,要作到一種平衡,才能既知足功能要求,又能保證性能。

 錯誤6:忽略Unicode/UTF-8問題

  php編程中,在處理非ascii字符時,會遇到一些問題,要很當心的去對待,要否則就會錯誤遍地。舉個簡單的例子,strlen($name),若是$name包含非ascii字符,那結果就有些出乎意料。在此給出一些建議,儘可能避免此類問題:

  • 若是你對unicode和utf-8不是很瞭解,那麼你至少應該瞭解一些基礎。推薦閱讀這篇文章
  • 最好使用mb_*函數來處理字符串,避免使用老的字符串處理函數。這裏要確保PHP的「multibyte」擴展已開啓。
  • 數據庫和表最好使用unicode編碼。
  • 知道jason_code()函數會轉換非ascii字符,但serialize()函數不會。
  • php代碼源文件最好使用不含bom的utf-8格式。

  在此推薦一篇文章,更詳細的介紹了此類問題: UTF-8 Primer for PHP and MySQL

 錯誤7:假定$_POST老是包含POST數據

  PHP中的$_POST並不是老是包含表單POST提交過來的數據。假設咱們經過 jQuery.ajax() 方法向服務器發送了POST請求:

1
2
3
4
5
6
7
// js
$.ajax({
    url: 'http://my.site/some/path' ,
    method: 'post' ,
    data: JSON.stringify({a: 'a' , b: 'b' }),
    contentType: 'application/json'
});

  注意代碼中的 contentType: ‘application/json’ ,咱們是以json數據格式來發送的數據。在服務端,咱們僅輸出$_POST數組:

1
2
// php
var_dump( $_POST );

  你會很驚奇的發現,結果是下面所示:

1
array (0) { }

  爲何是這樣的結果呢?咱們的json數據 {a: ‘a’, b: ‘b’} 哪去了呢?

  答案就是PHP僅僅解析Content-Type爲 application/x-www-form-urlencoded 或 multipart/form-data的Http請求。之因此這樣是由於歷史緣由,PHP最初實現$_POST時,最流行的就是上面兩種類型。所以雖然說如今有些類型(好比application/json)很流行,但PHP中仍是沒有去實現自動處理。

  由於$_POST是全局變量,因此更改$_POST會全局有效。所以對於Content-Type爲 application/json 的請求,咱們須要手工去解析json數據,而後修改$_POST變量。

1
2
// php
$_POST = json_decode( file_get_contents ( 'php://input' ), true);

  此時,咱們再去輸出$_POST變量,則會獲得咱們指望的輸出:

1
array (2) { [ "a" ]=> string(1) "a" [ "b" ]=> string(1) "b" }

 錯誤8:認爲PHP支持字符數據類型

  看看下面的代碼,猜想下會輸出什麼:

1
2
3
for ( $c = 'a' ; $c <= 'z' ; $c ++) {
    echo $c . "\n" ;
}

  若是你的回答是輸出’a'到’z',那麼你會驚奇的發現你的回答是錯誤的。

  不錯,上面的代碼的確會輸出’a'到’z',但除此以外,還會輸出’aa’到’yz’。咱們來分析下爲何會是這樣的結果。

  在PHP中不存在char數據類型,只有string類型。明白這點,那麼對’z'進行遞增操做,結果則爲’aa’。對於字符串比較大小,學過C的應該都知道,’aa’是小於’z'的。這也就解釋了爲什麼會有上面的輸出結果。

  若是咱們想輸出’a'到’z',下面的實現是一種不錯的辦法:

1
2
3
for ( $i = ord( 'a' ); $i <= ord( 'z' ); $i ++) {
    echo chr ( $i ) . "\n" ;
}

  或者這樣也是OK的:

1
2
3
4
5
$letters = range( 'a' , 'z' );
 
for ( $i = 0; $i < count ( $letters ); $i ++) {
    echo $letters [ $i ] . "\n" ;
}

 錯誤9:忽略編碼標準

  雖然說忽略編碼標準不會致使錯誤或是bug,但遵循必定的編碼標準仍是很重要的。

  沒有統一的編碼標準會使你的項目出現不少問題。最明顯的就是你的項目代碼不具備一致性。更壞的地方在於,你的代碼將更加難以調試、擴展和維護。這也就意味着你的團隊效率會下降,包括作一些不少無心義的勞動。

  對於PHP開發者來講,是比較幸運的。由於有PHP編碼標準推薦(PSR),由下面5個部分組成:

  • PSR-0:自動加載標準
  • PSR-1:基本編碼標準
  • PSR-2:編碼風格指南
  • PSR-3:日誌接口標準
  • PSR-4:自動加載

  PSR最初由PHP社區的幾個大的團體所建立並遵循。Zend, Drupal, Symfony, Joomla及其它的平臺都爲此標準作過貢獻並遵循這個標準。即便是PEAR,早些年也想讓本身成爲一個標準,但如今也加入了PSR陣營。

  在某些狀況下,使用什麼編碼標準是可有可無的,只要你使用一種編碼風格並一直堅持使用便可。可是遵循PSR標準不失爲一個好辦法,除非你有什麼特殊的緣由要 本身弄一套。如今愈來愈多的項目都開始使用PSR,大部分的PHP開發者也在使用PSR,所以使用PSR會讓新加入你團隊的成員更快的熟悉項目,寫代碼時 也會更加溫馨。

 錯誤10:錯誤使用empty()函數

  一些PHP開發人員喜歡用empty()函數去對變量或表達式作布爾判斷,但在某些狀況下會讓人很困惑。

  首先咱們來看看PHP中的數組Array和數組對象ArrayObject。看上去好像沒什麼區別,都是同樣的。真的這樣嗎?

1
2
3
4
5
6
// PHP 5.0 or later:
$array = [];
var_dump( empty ( $array ));         // outputs bool(true)  
$array = new ArrayObject();
var_dump( empty ( $array ));         // outputs bool(false)
// why don't these both produce the same output?

  讓事情變得更復雜些,看看下面的代碼:

1
2
3
4
5
// Prior to PHP 5.0:
$array = [];
var_dump( empty ( $array ));         // outputs bool(false)  
$array = new ArrayObject();
var_dump( empty ( $array ));         // outputs bool(false)

  很不幸的是,上面這種方法很受歡迎。例如,在Zend Framework 2中,Zend\Db\TableGateway 在 TableGateway::select() 結果集上調用 current() 方法返回數據集時就是這麼幹的。開發人員很容易就會踩到這個坑。

  爲了不這些問題,檢查一個數組是否爲空最後的辦法是用 count() 函數:

1
2
3
4
5
// Note that this work in ALL versions of PHP (both pre and post 5.0):
$array = [];
var_dump( count ( $array ));         // outputs int(0)
$array = new ArrayObject();
var_dump( count ( $array ));         // outputs int(0)

  在這順便提一下,由於PHP中會將數值0認爲是布爾值false,所以 count() 函數能夠直接用在 if 條件語句的條件判斷中來判斷數組是否爲空。另外,count() 函數對於數組來講複雜度爲O(1),所以用 count() 函數是一個明智的選擇。

  再來看一個用 empty() 函數很危險的例子。當在魔術方法 __get() 中結合使用 empty() 函數時,也是很危險的。咱們來定義兩個類,每一個類都有一個 test 屬性。

  首先咱們定義 Regular 類,有一個 test 屬性:

1
2
3
4
class Regular
{
    public $test = 'value' ;
}

  而後咱們定義 Magic 類,並用 __get() 魔術方法來訪問它的 test 屬性:

1
2
3
4
5
6
7
8
9
10
11
class Magic
{
    private $values = [ 'test' => 'value' ];
 
    public function __get( $key )
    {
        if (isset( $this ->values[ $key ])) {
            return $this ->values[ $key ];
        }
    }
}

  好了。咱們如今來看看訪問各個類的 test 屬性會發生什麼:

1
2
3
4
$regular = new Regular();
var_dump( $regular ->test);     // outputs string(4) "value"
$magic = new Magic();
var_dump( $magic ->test);       // outputs string(4) "value"

  到目前爲止,都仍是正常的,沒有讓咱們感到迷糊。

  但在 test 屬性上使用 empty() 函數會怎麼樣呢?

1
2
var_dump( empty ( $regular ->test));     // outputs bool(false)
var_dump( empty ( $magic ->test));       // outputs bool(true)

  結果是否是很意外?

  很不幸的是,若是一個類使用魔法 __get() 函數來訪問類屬性的值,沒有簡單的方法來檢查屬性值是否爲空或是不存在。在類做用域外,你只能檢查是否返回 null 值,但這並不必定意味着沒有設置相應的鍵,由於鍵值能夠被設置爲 null 。

  相比之下,若是咱們訪問 Regular 類的一個不存在的屬性,則會獲得一個相似下面的Notice消息:

1
2
3
4
Notice: Undefined property: Regular:: $nonExistantTest in /path/to/test.php on line 10
 
Call Stack:
    0.0012     234704   1. {main}() /path/to/test.php:0

  所以,對於 empty() 函數,咱們要當心的使用,要否則的話就會結果出乎意料,甚至潛在的誤導你。

相關文章
相關標籤/搜索