PHP 正則表達式匹配 preg_match 與 preg_match_all 函數

時間 2019-11-11

標籤 php 正則表達式匹配 preg match 函數欄目 PHP 简体版

原文原文鏈接

正則表達式在 PHP 中的應用

在 PHP 應用中，正則表達式主要用於：php

正則匹配：根據正則表達式匹配相應的內容
正則替換：根據正則表達式匹配內容並替換
正則分割：根據正則表達式分割字符串

在 PHP 中有兩類正則表達式函數，一類是 Perl 兼容正則表達式函數，一類是 POSIX 擴展正則表達式函數。兩者差異不大，並且推薦使用Perl 兼容正則表達式函數，所以下文都是以 Perl 兼容正則表達式函數爲例子說明。html

定界符

Perl 兼容模式的正則表達式函數，其正則表達式須要寫在定界符中。任何不是字母、數字或反斜線（）的字符均可以做爲定界符，一般咱們使用 / 做爲定界符。具體使用見下面的例子。web

提示

儘管正則表達式功能很是強大，但若是用普通字符串處理函數能完成的，就儘可能不要用正則表達式函數，由於正則表達式效率會低得多。關於普通字符串處理函數，請參見《PHP 字符串處理》。正則表達式

preg_match()

preg_match() 函數用於進行正則表達式匹配，成功返回 1 ，不然返回 0 。數組

語法：瀏覽器

int preg_match( string pattern, string subject [, array matches ] )

參數說明：ide

參數	說明
pattern	正則表達式
subject	須要匹配檢索的對象
matches	可選，存儲匹配結果的數組， $matches[0] 將包含與整個模式匹配的文本，$matches[1] 將包含與第一個捕獲的括號中的子模式所匹配的文本，以此類推

例子 1 ：函數

<?php
if(preg_match("/php/i", "PHP is the web scripting language of choice.", $matches)){
    print "A match was found:". $matches[0];
} else {
    print "A match was not found.";
}
?>

瀏覽器輸出：學習

A match was found: PHP

在該例子中，因爲使用了 i 修正符，所以會不區分大小寫去文本中匹配 php 。編碼

提示

preg_match() 第一次匹配成功後就會中止匹配，若是要實現所有結果的匹配，即搜索到subject結尾處，則需使用 preg_match_all() 函數。

例子 2 ，從一個 URL 中取得主機域名：

<?php
// 從 URL 中取得主機名
preg_match("/^(http:\/\/)?([^\/]+)/i","http://www.baidu.com/index.html", $matches);
$host = $matches[2];
// 從主機名中取得後面兩段
preg_match("/[^\.\/]+\.[^\.\/]+$/", $host, $matches);
echo "域名爲：{$matches[0]}";
?>

域名爲：baidu.com

preg_match_all()

preg_match_all() 函數用於進行正則表達式全局匹配，成功返回整個模式匹配的次數（可能爲零），若是出錯返回 FALSE 。

語法：

int preg_match_all( string pattern, string subject, array matches [, int flags ] )

參數說明：

參數	說明
pattern	正則表達式
subject	須要匹配檢索的對象
matches	存儲匹配結果的數組
flags	可選，指定匹配結果放入 matches 中的順序，可供選擇的標記有： PREG_PATTERN_ORDER：默認，對結果排序使 $matches[0] 爲所有模式匹配的數組，$matches[1] 爲第一個括號中的子模式所匹配的字符串組成的數組，以此類推 PREG_SET_ORDER：對結果排序使 $matches[0] 爲第一組匹配項的數組，$matches[1] 爲第二組匹配項的數組，以此類推 PREG_OFFSET_CAPTURE：若是設定本標記，對每一個出現的匹配結果也同時返回其附屬的字符串偏移量

下面的例子演示了將文本中全部 <pre></pre> 標籤內的關鍵字（php）顯示爲紅色。

<?php
$str = "<pre>學習php是一件快樂的事。</pre><pre>全部的phper須要共同努力！</pre>";
$kw = "php";
preg_match_all('/<pre>([\s\S]*?)<\/pre>/',$str,$mat);
for($i=0;$i<count($mat[0]);$i++){
    $mat[0][$i] = $mat[1][$i];
    $mat[0][$i] = str_replace($kw, '<span style="color:#ff0000">'.$kw.'</span>', $mat[0][$i]);
    $str = str_replace($mat[1][$i], $mat[0][$i], $str);
}
echo $str;
?>

正則匹配中文漢字

正則匹配中文漢字根據頁面編碼不一樣而略有區別：

GBK/GB2312編碼：[x80-xff]+ 或 [xa1-xff]+
UTF-8編碼：[x{4e00}-x{9fa5}]+/u

例子：

<?php
$str = "學習php是一件快樂的事。";
preg_match_all("/[x80-xff]+/", $str, $match);
//UTF-8 使用：
//preg_match_all("/[x{4e00}-x{9fa5}]+/u", $str, $match);
print_r($match);
?>

輸出：

Array
(
    [0] => Array
        (
            [0] => 學習
            [1] => 是一件快樂的事。
        )
 
)

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。