基於PHP/CURL/codeIgniter的Spider Webbot爬蟲[6]-PHP關於正則表達式的函數preg

preg_replace(pattern,replacement,subject)數組

pattern模式,其實就是要查找的字段。不能是數字,字母。若是是數字和字母的話,要用/string/來表示
replacement替換字段 要替換上的string,能夠是任意
subject操做目標,這裏能夠是一段string,也能夠使一個變量,或者一個http_get()。字符串

preg_match(pattern,subject)這個只返回bool真假
preg_match_all(pattern,subject,result_array)這個在返回bool真假的同時,還會返回一個二維數組,裏面有類似的字符,還有把這個string做爲一個數組元素
preg_split(pattern,subject)
若是在subject中找到了pattern,就在該處進行切割,而且不保留pattern
//返回result_array[0]=前半段,result_array[1]=後半段get

$subject_string="there are 129 stories about Tim and another 3129 about Tom";
/這是要匹配的內容/ 這是pattern
$subject_string //這是target字符串string

preg_match_all("/\d/",$subject_string,$matches_array);it

$matches_array=Array([0]=>1 [1]=>2 [2]=>9)

\跳脫符變量

匹配數字
\d能夠表示單獨一個數字,這樣一個下標表明一個數字
\d\d\d 能夠表明3個數字,而且一個下標表明三個數字
\d+表示取一整塊數字,直到最後一位不是數字im

匹配字母
\D匹配一個字母,
\D\D\D匹配3個字母,可是,若是不加上\b進行邊界定位,就會匹配全部含有三個字母的狀況
好比Tom,Tom,There之中的the,也會被抓取二維數組

/\b\D\D\D\b/這樣能夠正確匹配3個字母,等價於/\b\D{3}\b/字符

萬用字元數字

相關文章
相關標籤/搜索