你真的瞭解如今的PHP嗎?

前段時間,公司的項目從PHP5.3升級到PHP7,如今項目裏開始使用PHP7的一些新語法和特性。反觀PHP的5.四、5.五、5.6版本,有點認知缺失的感受。因此,決定看《Modern PHP》補一補裏面的一些概念。php


1、特性

1. 命名空間

命名空間用的比較多,不詳細寫了,記錄幾個值得注意的實踐和細節。
多重導入
別這麼作,這樣寫容易讓人困惑。html

<?php
use Symfony\Component\HttpFoundation\Request,
    Symfony\Component\HttpFoundation\Response,
    Symfony\Component\HttpFoundation\Cookie;

建議一行寫一個use語句:前端

<?php
use Symfony\Component\HttpFoundation\Request;
use Symfony\Component\HttpFoundation\Response;
use Symfony\Component\HttpFoundation\Cookie;

一個文件中使用多個命名空間
你能夠這麼作,但這違背了「一個文件定義一個類」的良好實踐。nginx

<?php
namespace Foo {
  //code
}

namespace Bar {
  //code 
}

全局命名空間
想要使用PHP原生的Exception類,須要在類名前加 \ 符號。laravel

<?php
namespace My\App;

class Foo
{
  public function doSomething()
  {
    $exception = new \Exception();
  }
}

若是Exception前不加 \ 符號,會在My\App命名空間下尋找Exception類。web

2. 使用接口

使用接口編寫的代碼更靈活,能委託其餘人實現細節。使用的人只須要關心有什麼接口,而不須要關心實現。可以很好地解耦代碼,方便擴展,比較經常使用就不說啦。正則表達式

3. 性狀

在學習laravel框架以前都沒弄清楚性狀(trait)。這是PHP5.4.0引入的新概念,既像類又像接口。但它兩個都不是。算法

性狀是類的部分實現,能夠混入一個或多個現有PHP類中。相似Ruby的組合模塊活混入(mixin)。sql

爲何使用性狀
舉個具體的例子,好比有兩個類,Car 和 Phone,他們都須要GPS功能。爲了解決這個問題,第一反應建立一個父類,而後讓Car和Phone繼承它。但由於很明顯,這個祖先不屬於各自的繼承層次結構。數據庫

第二反應建立一個GPS的接口,定義好GPS的功能接口,而後讓Car和Phone兩個類都實現這個接口。這樣作能實現功能,同時也能保持天然的繼承層級結構。不過,這就使得在兩個都要實現重複的GPS功能,這不符合DRY(dont repeat yourself)原則。

第三反應建立實現GPS功能的性狀(trait),而後在Car和Phone類中混入這個性狀。能實現功能,不影響繼承結構,不重複實現,完美。

建立與使用性狀
建立trait

<?php
trait MyTrait{
  //實現
}

使用trait

<?php
class MyClass
{
  use MyTrait;
  // 類的實現
}

4. 生成器

PHP生成器(generator)是PHP5.5.0引入的新功能,不少PHP開發者生成器不瞭解。生成器是個簡單的迭代器,但生成器不要求實現Iterator接口。生成器會根據須要計算併產生要迭代的值。若是不查詢,生成器永遠不知道下一個要迭代的值是什麼,在生成器中沒法後退或快進。具體看以下兩個例子:

簡單的生成器

<?php
function makeRange($length) {
  for ($i = 0; $i < $length; $i++) {
    yield $i;
  }
}

foreach (makeRange(1000000) as $i) {
  echo $i, PHP_EOL;
}

具體場景:使用生成器處理CSV文件

<?php
function getRows($file) {
  $handle = fopen($file, 'rb');
  if ($handle === false) {
    throw new Exception();
  }
  while (feof($handle) === false) {
    yield fgetcsv($handle);
  }
}

foreach (getRows('data.csv') as $row) {
  print_r($row);
}

處理這種場景,習慣的處理方法是先讀取文件的全部內容放到數組中,而後再作處理等等。這種的處理存在的問題是:當文件特別大,一次讀取就佔用不少內存資源。而生成器最適合這種場景,由於這樣佔用的系統內存量極少。

5. 閉包

理論上,閉包和匿名函數是不一樣的概念。不過,PHP將其視做相同的概念。
簡單閉包

<?php
$closure = function ($name) {
  return sprintf('Hello %s', $name);
}

echo $closure("Beck");
// 輸出 --> 「Hello Beck」

注意:咱們之因此能調用$closure變量,是由於這個變量的值是個閉包,並且閉包對象實現了__invoke()魔術方法。只要變量名後有(),PHP就會查找並調用__invoke()方法。

附加狀態
使用use關鍵字能夠把多個參數傳入閉包,此時要像PHP函數或方法的參數同樣,使用逗號分隔多個參數。

<?php
function enclosePerson($name) {
  return function ($doCommand) use ($name) {
    return sprintf('%s, %s', $name, $doCommand);
  };
}

// 把字符串「Clay」封裝在閉包中
$clay = enclosePerson('Clay');

// 傳入參數,調用閉包
echo $clay('get me sweet tea!');
// 輸出 --> "Clay, get me sweet tea!"

使用bindTo()方法附加閉包的狀態
PHP框架常用bindTo()方法把路由URL映射到匿名回調函數上,框架會把匿名函數綁定到應用對象上,這麼作能夠在這個匿名函數中使用$this關鍵字引用重要的應用對象。例子以下:

<?php
class App
{
  protected $routes = array();
  protected $responseStatus = '200 OK';
  protected $responseContentType = 'text/html';
  protected $responseBody = 'Hello world';

  public function addRoute($routePath, $routeCallback)
  {
    $this->routes[$routePath] = $routeCallback->bindTo($this, __CLASS__);//重點
  }

  public function dispatch($currentPath)
  {
    foreach ($this->routes as $routePath => $callback) {
      if ($routePath === $currentPath) {
        $callback();
      }
    }

    header('HTTP/1.1' . $this->responseStatus);
    header('Content-type:' . $this->responseContentType);
    header('Content-length' . mb_strlen($this->responseBody));
    echo $this->responseBody;
  }
}

第11行是重點所在,把路由回調綁定到了當前的App實例上。這麼作能在回調函數中處理App實例的狀態:

<?php
$app = new App();
$app->addRoute('/users/josh', function () {
  $this->responseContentType = 'application/json;charset=utf8';
  $this->responseBody = '{"name": "Josh"}';
});
$app->dispatch('/users/josh');

6. Zend OPcache

字節碼緩存不是PHP的新特性,不少獨立的擴展能夠實現緩存。從PHP5.5.0開始,PHP內置了字節碼緩存功能,名爲Zend OPcache

字節碼緩存是什麼
PHP是解釋性語言,PHP解釋器執行PHP腳本時會解析PHP腳本代碼,把PHP代碼編譯成一系列Zend操做碼,而後執行字節碼。每次請求PHP文件都是這樣,會消耗不少資源。字節碼緩存能存儲預先編譯好的PHP字節碼。這意味着,請求PHP腳本時,PHP解釋器不用每次都讀取、解析和編譯PHP代碼。這樣能極大地提高應用的性能。

7. 內置的HTTP服務器

從PHP5.4.0起,PHP內置了Web服務器,這對衆多使用Apache或nginx的php開發者來講,多是個隱藏功能。不過,這個內置的服務器功能並不完善,不該該在生產環境中使用,但對本地開發來講是個便利的工具,能夠用於快速預覽一些框架和應用。

啓動服務器

php -S localhost:4000

配置服務器

php -S localhost:8000 -c app/config/php.ini

路由器腳本
與Apache和nginx不一樣,它不支持.htaccess文件。所以,這個服務器很難使用多數流行的PHP框架中常見的前端控制器。PHP內置的服務器使用路由器腳本彌補了這個遺漏的功能。處理每一個HTTP請求前,會先通過這個路由器腳本,若是結果爲false,返回當前HTTP請求中引用的靜態資源URI。

php -S localhost:8000 route.php

是否爲內置的服務器

<?php
if (php_sapi_name() === 'cli-server') {
  // php 內置的web服務器
}

  

2、標準 若是你瞭解PHP-FIG和PSR能夠跳過這部分

PHP組件和框架的數量不少,隨之產生的問題就是:單獨開發的框架沒有考慮到與其餘框架的通訊。這樣對開發者和框架自己都是不利的。

打破舊局面的PHP-FIG
多位PHP框架的開發者認識到了這個問題,在2009年的 php|tek(一個受歡迎的PHP會議)上談論了這個問題。通過討論後得出:咱們須要一個標準,用來提升框架的互操做性。因而這幾位在php|tek意外碰頭的PHP框架開發者組織了PHP Framework Interop Group,簡稱PHP-FIG。

PHP-FIG是框架表明自發組織的,其成員不是選舉產生的,任何人均可以申請加入PHP-FIG,而且能對處於提議階段的推薦規範提交反饋。另外,PHP-FIG發佈的是推薦規範,而不是強制規定。

1.PSR是什麼?

PSR是PHP Standards Recommendation(PHP推薦標準)的簡稱。截至今日,PHP-FIG發佈了五個推薦規範:

你會發現只有四個,沒錯,由於第一份推薦規範PSR-0廢棄了,新發布的PSR-4替代了。

2.PSR-1:基本的代碼風格

若是想編寫符合社區標準的PHP代碼,首先要遵照PSR-1。遵照這個標準很是簡單,可能你已經再使用了。標準的細節就不寫啦,點連接就能看。

3.PSR-2:嚴格的代碼風格

PSR-2是在PSR-1的基礎上更進一步的定義PHP代碼規範。這個標準解決了不少世紀問題哈,好比縮進,大括號等等。細節也很少記錄啦。

另外,如今不少IDE(好比,PHPStorm)會有代碼格式化功能,設置代碼格式化的標準,編寫完代碼,而後所有格式化,能夠幫助你遵循推薦規範,修復一些換行、縮進、大括號等細節。


4.PSR-3:日誌記錄器接口

這個推薦規範與前兩個不一樣,這是一個接口,規定PHP日誌記錄器組件能夠實現的方法。符合PSR-3推薦規範的PHP日誌記錄器組件,必須包含一個實現Psr\Log\LoggerInterface接口的PHP類。PSR-3接口複用了RFC 5424系統日誌協議,規定要實現的九個方法:

<?php
namespace Psr\Log;

interface LoggerInterface
{
  public function emergency($message, array $context = array());
  public function alert($message, array $context = array());
  public function critical($message, array $context = array());
  public function error($message, array $context = array());
  public function warning($message, array $context = array());
  public function notice($message, array $context = array());
  public function info($message, array $context = array());
  public function debug($message, array $context = array());
  public function log($level, $message, array $context = array());
}

每一個方法對應RFC 5424協議的一個日誌級別。

使用PRS-3日誌記錄器
若是你正在編寫本身的PSR-3日誌記錄器,能夠停下來了。由於已經有一些十分出色的日誌記錄器組件。好比:monolog/monolog,直接用就能夠了。若是不能知足要求,也建議在此基礎上作擴展。

5.PSR-4:自動加載器

這個推薦規範描述了一個標準的自動加載器策略。自動加載器策略是指,在運行時按需查找PHP類,接口或性狀,並將其載入PHP解釋器。

爲何自動加載很重要
在PHP文件的頂部你是否是常常看到相似下面的代碼?

<?php
include 'path/to/file1.php';
include 'path/to/file2.php';
include 'path/to/file3.php';

若是隻需載入幾個PHP腳本,使用這些函數(include()、include_once()、require()、require_once())能很好的完成工做。但是若是你要引入一千個PHP腳本呢?

在PSR-4推薦規範以前,PHP組件和框架的做者使用__autoload()和spl_autoload_register()函數註冊自定義的自動加載器策略。但是,每一個PHP組件和框架的自動加載器都使用獨特的自動加載器。所以,使用的組件多的時候,也是很麻煩的事情。

推薦使用PSR-4自動加載器規範,就是解決這個問題,促進組件實現互操做性。

PSR-4自動加載器策略
PSR-4推薦規範不要求改變代碼的實現方式,只建議如何使用文件系統目錄結構和PHP命名空間組織代碼。PSR-4的精髓是把命名空間的前綴和文件系統中的目錄對應起來。好比,我能夠告訴PHP,\Oreilly\ModernPHP命名空間中的類、接口和性狀在物理文件系統的src/目錄中,這樣PHP就知道,前綴爲\Oreilly\ModernPHP的命名空間中的類、接口和性狀對應的src/目錄裏的目錄和文件。

如何編寫PSR-4自動加載器
若是你在寫本身的PSR-4自動加載器,請停下來。咱們可使用依賴管理器Composer自動生成的PSR-4自動加載器。

3、良好實踐

1.過濾、驗證和轉義

過濾HTML

使用htmlentities()函數過濾輸入。

<?php
$input = '<p><script>alert("You won the Nigerian lottery!");</script></p>';
echo htmlentities($input, ENT_QUOTES, 'UTF-8');

須要注意的是:默認狀況下,htmlentities()函數不會轉義單引號,並且也檢測不出輸入字符串的字符集。正確的使用方式是:第一個參數輸入字符串;第二個參數設爲ENT_QUOTES常量,轉移單引號;第三個參數設爲輸入字符串的字符集。

更多過濾HTML輸入的方式,可使用HTML Purifier庫。這個庫強健且安全,缺點:慢,且可能難以配置。

SQL查詢

構建SQL查詢很差的方式:

$sql = sprintf(
  'UPDATE users SET password = "%s" WHERE id = %s',
  $_POST['password'],
  $_GET['id']
);

若是 psasword=abc";-- ,則致使修改了整個users表的記錄password都未abc。若是須要在SQL查詢中使用輸入數據,要使用PDO預處理語句。

用戶資料信息

A.過濾用戶資料中的電子郵件地址
這裏會刪除除字符、數字和!#$%&'*+-/=?^_{|}~@.[]`以外的全部其餘符號。

<?php
$email = 'beckjiang@meijiabang.cn';
$emailSafe = filter_var($email, FILTER_SANITIZE_EMAIL);

B.過濾用戶資料中的外國字符

<?php
$string = "外國字符";
$safeString = filter_var(
  $string,
  FILTER_SANITIZE_STRING,
  FILTER_FLAG_STRIP_LOW|FILTER_FLAG_ENCODE_HIGH
);

驗證數據

驗證數據與過濾不一樣,驗證不會從輸入數據中刪除信息,而是隻確認輸入數據是否符合預期。

驗證電子郵件地址
咱們能夠把某個FILTER_VALIDATE_*標誌傳給filter_var()函數,除了電子郵件地址,還能夠驗證布爾值、浮點數、整數、IP地址、正則表達式和URL。

<?php
$input = 'beckjiang@meijiabang.cn';
$isEmail = filter_var($input, FILTER_VALIDAE_EMAIL);
if ($isEmail !== false) {
  echo "Success";
} else {
  echo "Fail";
}

2.密碼

哈希算法有不少種,例如:MD五、SHA一、bcrypt和scrypt。有些算法的速度很快,用於驗證數據完整性;有些算法速度則很慢,旨在提升安全性。生成密碼和存儲密碼時須要使用速度慢、安全性高的算法。

目前,經同行審查,最安全的哈希算法是bcrypt。與MD5和SHA1不一樣,bcrypt是故意設計的很慢。bcrypt算法會自動加鹽,防止潛在的彩虹表攻擊。bcrypt算法永不過期,若是計算機的運算速度變快了,咱們只需提升工做因子的值。

從新計算密碼的哈希值
下面是登陸用戶的腳本:

<?php
session_start();
try {
  // 從請求主體中獲取電子郵件地址
  $email = filter_input(INPUT_POST, 'email');

  // 從請求主體中獲取密碼
  $password = filter_input(INPUT_POST, 'password');

  // 使用電子郵件地址獲取用戶(注意,這是虛構代碼)
  $user = User::findByEmail($email);

  // 驗證密碼和帳戶的密碼哈希值是否匹配
  if (password_verify($password, $user->password_hash) === false) {
    throw new Exception('Invalid password');
  }

  // 若是須要,從新計算密碼的哈希值
  $currentHashAlgorithm = PASSWORD_DEFAULT;
  $currentHashOptions = array('cost' => 15);
  $passwordNeedRehash = password_needs_rehash(
    $user->password_hash,
    $currentHashAlgorithm,
    $currentHashOptions
  );
  if ($passwordNeedsRehash === true) {
    // 保存新計算得出的密碼哈希值(注意,這是虛構代碼)
    $user->password_hash = password_hash(
      $password,
      $currentHashAlgorithm,
      $currentHashOptions
    );
    $user->save();
  }
  // 把登陸狀態保存到回話中
  ...
  // 重定向到我的資料頁面
  ...

} catch (Exception $e) {
  //異常處理
  ...
}

值得注意的是:在登陸前,必定要使用password_needs_rehash()函數檢查用戶記錄中現有的密碼哈希值是否過時。若是過時了,要從新計算密碼哈希值。

PHP5.5.0以前的密碼哈希API
若是沒法使用PHP5.5.0或以上版本,可使用安東尼·費拉拉開發的ircmaxell/password-compat組件。這個組件實現了PHP密碼哈希API中的全部函數:

  • password_hash()
  • password_get_info()
  • password_needs_rehash()
  • password_verify()

3.日期、時間和時區

DateTime類

DateTime類提供一個面向對象接口,用於管理日期和時間。

沒有參數,建立的是一個表示當前日期和時間的實例:

<?php
$datetime = new DateTime();

傳入參數建立實例:

<?php
$datetime = new DateTime('2017-01-28 15:27');

指定格式,靜態構造:

<?php
$datetime = DateTime::createFromFormat('M j, Y H:i:s', 'Jan 2, 2017 15:27:30');

DateInterval類

DateInterval實例表示長度固定的時間段(好比,「兩天」),或者相對而言的時間段(好比,「昨天」)。DateInterval實例用於修改DateTime實例。

使用DateInterval類:

<?php
// 建立DateTime實例
$datetime = new DateTime();

// 建立長度爲兩週的間隔
$interval = new DateInterval('P2W');

// 修改DateTime實例
$datetime->add($interval);
echo $datetime->format('Y-m-d H:i:s');
建立反向的DateInterval實例:

<?php
// 過去一天
$interval = new DateInterval('-1 day');

DateTimeZone類

若是應用要迎合國際客戶,可能要和時區鬥爭。

建立、使用時區:

<?php
$timezone = new DateTimeZone('America/New_York');
$datetime = new DateTime('2017-01-28', $timezone);

實例化以後,也可使用setTimeZone()函數設置市區:

$datetime->setTimeZone(new DateTimeZone('Asia/Hong_Kong'));

DatePeriod類

有時咱們須要迭代處理一段時間內反覆出現的一系列日期和時間,DatePeriod類能夠解決這種問題。DatePeriod類的構造方法接受三個參數,並且都必須提供:

  • 一個Datetime實例,表示迭代開始時的日期和時間。
  • 一個DateInterval實例,表示到下個日期和時間的間隔。
  • 一個整數,表示迭代的總次數。

DatePeriod實例是迭代器,每次迭代時都會產出一個DateTime實例。

使用DatePeriod類:

<?php
$start = new DateTime();
$interval = new DateInterval('P2W');
$period = new DatePeriod($start, $interval, 3);

foreach ($period as $nextDateTime) {
  echo $nextDateTime->format('Y-m-d H:i:s'), PHP_EOL;
}

4.數據庫

PHP應用能夠在不少種數據庫中持久保存信息,好比:MySQL、SQLite、Oracle等。若是在項目中使用多種數據庫,須要安裝並學習多種PHP數據庫擴展和接口,這增長了認知和技術負擔。

正是基於這個緣由,PHP原生提供了PDO擴展(PHP Data Objects,意思是PHP數據對象),PDO是一系列PHP類,抽象了不一樣數據庫的具體實現。PDO的介紹和使用就不寫了,比較經常使用。

5.流

在現代的PHP特性中,流或許是最出色但最少使用的。雖然PHP4.3.0就引入了流,但不少開發者不知道流的存在,由於不多人說起流,並且流的文檔也匱乏。官方的解釋比較難理解,一句話說就是:流的做用是在出發地和目的地之間傳輸數據。

我把流理解爲管道,至關於把水從一個地方引到另外一個地方。在水從出發地流到目的地的過程當中,咱們能夠過濾水,能夠改變水質,能夠添加水,也能夠排出水(提示:水是數據的隱喻)。

流封裝協議

流式數據的種類各異,每種類型須要獨特的協議,以便讀寫數據。咱們稱這些協議爲流封裝協議。好比,咱們能夠讀寫文件系統,能夠經過HTTP、HTTPS或SSH與遠程Web服務器通訊,還能夠打開並讀寫ZIP、RAR或PHAR壓縮文件。這些通訊方式都包含下述相同的過程:

  1. 開始通訊。
  2. 讀取數據。
  3. 寫入數據。
  4. 結束通訊。

雖然過程同樣的,可是讀寫文件系統中文件的方式與手法HTTP消息的方式有所不一樣。流封裝協議的做用是使用通用的幾口封裝這些差別。

每一個流都有一個協議和一個目標。格式以下:

<scheme>://<target>

說這麼多有點懵,先看例子,使用HTTP流封裝協議與Flickr API通訊:

<?php
$json = file_get_contents(
  'http://api.flickr.com/services/feeds/photos_public.gne?format=json'
);

不要誤覺得這是普通的網頁URL,file_get_contents()函數的字符串參數實際上是一個流標識符。http協議會讓PHP使用HTTP流封裝協議。看起來像是普通的網頁URL,是由於HTTP流封裝協議就是這樣規定的:)。其餘流封裝協議可能不是這樣。

file://流封裝協議

咱們使用file_get_contents()fopen()fwrite()fclose()函數讀寫文件系統。由於PHP默認使用的流封裝協議是file://,因此咱們不多認爲這些函數使用的是PHP流。

隱式使用file://流封裝協議:

<?php
$handle = fopen('/etc/hosts', 'rb');
while (feof($handle) !== true) {
  echo fgets($handle);
}
fclose($handle);

顯式使用file://流封裝協議:

<?php
$handle = fopen('file:///etc/hosts', 'rb');
while (feof($handle) !== true) {
  echo fgets($handle);
}
fclose($handle);

流上下文

有些PHP流能接受一些列可選的參數,這些參數叫流上下文,用於定製流的行爲。流上下文使用stream_context_create()函數建立。

好比,你知道可使用file_get_contents()函數發送HTTP POST請求嗎?若是想這麼作,可使用一個流上下文對象:

<?php
$requestBody = '{"username": "beck"}';
$context = stream_context_create(array(
  'http' => array(
    'method' => 'POST',
    'header' => "Content-Type: application/json;charset=utf-8;\r\n" . 
                "Content-Length: " . mb_strlen($requestBody),
    "content" => $requestBody
  )
));
$response = file_get_contents('https://my-api.com/users', false, $context);

流過濾器

關於PHP的流,其實真正強大的地方在於過濾、轉換、添加或刪除流中傳輸的數據。

注意:PHP內置了幾個流過濾器:string.rot1三、string.toupper、string.tolower和string.strp_tags。這些過濾器沒什麼用,咱們要使用自定義的過濾器。

若想把過濾器附加到現有的流上,要使用stream_filter_append()函數。好比,想要把文件中的內容轉換成大寫字母,可使用string.toupper過濾器。書中不建議使用這個過濾器,這裏只是演示如何把過濾器附加到流上:

<?php
$handle = fopen('data.txt', 'rb');
stream_filter_append($handle, 'string.toupper');
while (feof($handle) !== true) {
  echo fgets($handle); // <-- 輸出的全是大寫字母
}
fclose($handle);

使用php://filter流封裝協議把過濾器附加到流上:

<?php
$handle = fopen('php://filter/read=string.toupper/resource=data.txt', 'rb');
while (feof($handle) !== true) {
  echo fgets($handle); // <-- 輸出的全是大寫字母
}
fclose($handle);

來看個更實際的流過濾器示例,假如咱們nginx訪問日誌保存在rsync.net,一天的訪問狀況保存在一個日誌文件中,並且會使用bzip2壓縮每一個日誌文件,名稱格式爲:YYYY-MM-DD.log.bz2。某天,領導讓我提取過去30天某個域名的訪問數據。使用DateTime類和流過濾器迭代bzip壓縮的日誌文件:

<?php
$dateStart = new \DateTime();
$dateInterval = \DateInterval::createFromDateString('-1 day');
$datePeriod = new \DatePeriod($dateStart, $dateInterval, 30);//建立迭代器
foreach ($datePeriod as $date) {
  $file = 'sftp://USER:PASS@rsync.net/' . $date->format('Y-m-d') . 'log.bz2';
  if (file_exists($file)) {
    $handle = fopen($file, 'rb');
    stream_filter_append($handle, 'bzip2.decompress');
    while (feof($handle) !== true) {
      $line = fgets($handle);
      if (strpos($line, 'www.example.com') !== false) {
        fwrite(STDOUT, $line);
      }
    }
    fclose($handle);
  }
}

計算日期範圍,肯定日誌文件的名稱,經過FTP鏈接rsync.net,下載文件,解壓縮文件,逐行迭代每一個文件,把相應的行提取出來,而後把訪問數據寫入一個輸出目標。使用PHP流,不到20行代碼就能作完全部這些事情。

自定義流過濾器

其實大多數狀況下都要使用自定義的流過濾器。自定義的流過濾器是個PHP類,繼承內置的php_user_filter類。這個類必須實現filter()onCreate()onClose()方法。並且,必須使用stream_filter_register()函數註冊自定義的流過濾器。

PHP流會把數據分紅按次序排列的桶,一個桶中盛放的流數據量是固定的。必定時間內過濾器接收到的桶叫作桶隊列。桶隊列中的每一個桶對象都有兩個公開屬性:data和datalen,分別是桶中的內容和內容的長度。

下面定義一個處理髒字的流過濾器:

<?php
class DirtyWordsFilter extends php_user_filter
{
  /**
   * @param resource $in         流來的桶隊列
   * @param resource $out        流走的桶隊列
   * @param resource $consumed   處理的字節數
   * @param resource $closing    是流中最後一個桶隊列嗎?
   */
  public function filter()
  {
    $words = array('grime', 'dirt', 'grease');
    $wordData = array();
    foreach ($words as $word) {
      $replacement = array_fill(0, mb_strlen($word), '*');
      $wordData[$word] = implode(' ', $replacement);
    }
    $bad = array_keys($wordData);
    $goods = array_values($wordData);

    // 迭代流來的桶隊列中的每一個桶
    while ($bucket = stream_bucket_make_writeable($in)) {
      // 審查桶數據中的髒字
      $bucket->data = str_replace($bad, $goods, $bucket->data);

      // 增長已處理的數據量
      $consumed += $bucket->datalen;

      // 把桶放入流向下游的隊列中
      stream_bucket_append($out, $bucket);
    }

    return PSFS_PASS_ON;
  }
}

filter()方法的做用是接受、處理再轉運桶中的流數據。這個方法的返回值是PSFS_PASS_ON常量,表示操做成功。

註冊流過濾器
接着,咱們必須使用stream_filter_register()函數註冊這個自定義的DirtWordsFilter流過濾器:

<?php
stream_filter_register('dirty_words_filter', 'DirtWordsFilter');

第一個參數是用於識別這個自定義過濾器的過濾器名,第二個參數是自定義過濾器的類名。

使用DirtWordsFilter流過濾器

<?php
$handle = fopen('data.txt', 'rb');
stream_filter_append($handle, 'dirty_words_filter');
while (feof($handle) !== true) {
  echo fgets($handle); // <-- 輸出審查後的文本
}
fclose($handle);

6.錯誤與異常

對錯誤和異常的處理,必定要遵照四個規則:

  • 必定要讓PHP報告錯誤。
  • 在開發環境中要顯示錯誤。
  • 在生產環境中不能顯示錯誤。
  • 在開發環境和生產環境中都要記錄錯誤。

錯誤與異常在平常使用的比較多,就不記錄啦!

相關文章
相關標籤/搜索