PHP中被忽略的性能優化利器:生成器

若是是作Python或者其餘語言的小夥伴,對於生成器應該不陌生。但不少PHP開發者或許都不知道生成器這個功能,多是由於生成器是PHP 5.5.0才引入的功能,也能夠是生成器做用不是很明顯。可是,生成器功能的確很是有用。php

優勢

直接講概念估計你聽完仍是一頭霧水,因此咱們先來講說優勢,也許能勾起你的興趣。那麼生成器有哪些優勢,以下:html

  • 生成器會對PHP應用的性能有很是大的影響
  • PHP代碼運行時節省大量的內存
  • 比較適合計算大量的數據

那麼,這些神奇的功能到底是如何作到的?咱們先來舉個例子。數組

概念引入

首先,放下生成器概念的包袱,來看一個簡單的PHP函數:瀏覽器

function createRange($number){
    $data = [];
    for($i=0;$i<$number;$i++){
        $data[] = time();
    }
    return $data;
}

這是一個很是常見的PHP函數,咱們在處理一些數組的時候常常會使用。這裏的代碼也很是簡單:函數

  1. 咱們建立一個函數。
  2. 函數內包含一個for循環,咱們循環的把當前時間放到$data裏面
  3. for循環執行完畢,把$data返回出去。

下面沒完,咱們繼續。咱們再寫一個函數,把這個函數的返回值循環打印出來:性能

$result = createRange(10); // 這裏調用上面咱們建立的函數
foreach($result as $value){
    sleep(1);//這裏停頓1秒,咱們後續有用
    echo $value.'<br />';
}

咱們在瀏覽器裏面看一下運行結果:spa

圖片描述

這裏很是完美,沒有任何問題。(固然sleep(1)效果大家看不出來)插件

思考一個問題

咱們注意到,在調用函數createRange的時候給$number的傳值是10,一個很小的數字。假設,如今傳遞一個值10000000(1000萬)。日誌

那麼,在函數createRange裏面,for循環就須要執行1000萬次。且有1000萬個值被放到$data裏面,而$data數組在是被放在內存內。因此,在調用函數時候會佔用大量內存。code

這裏,生成器就能夠大顯身手了。

建立生成器

咱們直接修改代碼,大家注意觀察:

function createRange($number){
    for($i=0;$i<$number;$i++){
        yield time();
    }
}

看下這段和剛剛很像的代碼,咱們刪除了數組$data,並且也沒有返回任何內容,而是在time()以前使用了一個關鍵字yield

使用生成器

咱們再運行一下第二段代碼:

$result = createRange(10); // 這裏調用上面咱們建立的函數
foreach($result as $value){
    sleep(1);
    echo $value.'<br />';
}

圖片描述

咱們奇蹟般的發現了,輸出的值和第一次沒有使用生成器的不同。這裏的值(時間戳)中間間隔了1秒。

這裏的間隔一秒其實就是sleep(1)形成的後果。可是爲何第一次沒有間隔?那是由於:

  • 未使用生成器時:createRange函數內的for循環結果被很快放到$data中,而且當即返回。因此,foreach循環的是一個固定的數組。
  • 使用生成器時:createRange的值不是一次性快速生成,而是依賴於foreach循環。foreach循環一次,for執行一次。

到這裏,你應該對生成器有點兒頭緒。

深刻理解生成器

代碼剖析

下面咱們來對於剛剛的代碼進行剖析。

function createRange($number){
    for($i=0;$i<$number;$i++){
        yield time();
    }
}

$result = createRange(10); // 這裏調用上面咱們建立的函數
foreach($result as $value){
    sleep(1);
    echo $value.'<br />';
}

咱們來還原一下代碼執行過程。

  1. 首先調用createRange函數,傳入參數10,可是for值執行了一次而後中止了,而且告訴foreach第一次循環能夠用的值。
  2. foreach開始對$result循環,進來首先sleep(1),而後開始使用for給的一個值執行輸出。
  3. foreach準備第二次循環,開始第二次循環以前,它向for循環又請求了一次。
  4. for循環因而又執行了一次,將生成的時間戳告訴foreach.
  5. foreach拿到第二個值,而且輸出。因爲foreachsleep(1),因此,for循環延遲了1秒生成當前時間

因此,整個代碼執行中,始終只有一個記錄值參與循環,內存中也只有一條信息。

不管開始傳入的$number有多大,因爲並不會當即生成全部結果集,因此內存始終是一條循環的值。

概念理解

到這裏,你應該已經大概理解什麼是生成器了。下面咱們來講下生成器原理。

首先明確一個概念:生成器yield關鍵字不是返回值,他的專業術語叫產出值,只是生成一個值

那麼代碼中foreach循環的是什麼?實際上是PHP在使用生成器的時候,會返回一個Generator類的對象。foreach能夠對該對象進行迭代,每一次迭代,PHP會經過Generator實例計算出下一次須要迭代的值。這樣foreach就知道下一次須要迭代的值了。

並且,在運行中for循環執行後,會當即中止。等待foreach下次循環時候再次和for索要下次的值的時候,for循環纔會再執行一次,而後當即再次中止。直到不知足條件不執行結束。

實際開發應用

不少PHP開發者不瞭解生成器,其實主要是不瞭解應用領域。那麼,生成器在實際開發中有哪些應用?

讀取超大文件

PHP開發不少時候都要讀取大文件,好比csv文件、text文件,或者一些日誌文件。這些文件若是很大,好比5個G。這時,直接一次性把全部的內容讀取到內存中計算不太現實。

這裏生成器就能夠派上用場啦。簡單看個例子:讀取text文件

圖片描述

咱們建立一個text文本文檔,並在其中輸入幾行文字,示範讀取。

<?php
header("content-type:text/html;charset=utf-8");
function readTxt()
{
    # code...
    $handle = fopen("./test.txt", 'rb');

    while (feof($handle)===false) {
        # code...
        yield fgets($handle);
    }

    fclose($handle);
}

foreach (readTxt() as $key => $value) {
    # code...
    echo $value.'<br />';
}

圖片描述

經過上圖的輸出結果咱們能夠看出代碼徹底正常。

可是,背後的代碼執行規則卻一點兒也不同。使用生成器讀取文件,第一次讀取了第一行,第二次讀取了第二行,以此類推,每次被加載到內存中的文字只有一行,大大的減少了內存的使用。

這樣,即便讀取上G的文本也不用擔憂,徹底能夠像讀取很小文件同樣編寫代碼。

推薦一個咱們團隊本身開發的針對開發者的網址導航:筆點導航 - 用心作最簡潔的網址導航

  1. 能夠自定義網址
  2. 能夠自定義分類
  3. 分類能夠標記顏色
  4. 自定義皮膚
  5. 自定義搜索
  6. 網址拖拽排序
  7. 自定義插件小模塊

圖片描述

相關文章
相關標籤/搜索