<?php// 指定網頁$url = "http://aihuinong.com/goods/";// 啓動curl$ch = curl_init();// CURLOPT_URL: 這是你想用PHP取回的URL地址。你也能夠在用curl_init()函數初始化時設置這個選項。curl_setopt ($ch, CURLOPT_URL, $url);//(後面參數爲1時) 若是成功只將結果返回,不自動輸出任何內容。若是失敗返回FALSE//(後面參數爲0時) 若是成功只返回TRUE,自動輸出返回的內容。若是失敗返回FALSEcurl_setopt ($ch, CURLOPT_RETURNTRANSFER, 1);// CURLOPT_CONNECTTIMEOUT 在發起鏈接前等待的時間,若是設置爲0,則不等待。curl_setopt ($ch, CURLOPT_CONNECTTIMEOUT,10);// curl_exec — 執行一個curl會話$dxycontent = curl_exec($ch);// 匹配class="yt-goods-nav" - class="pagination"之間的內容$pattern = '/<div class="yt-goods-nav">(.+?)<div class="pagination" style="float: right">/is';// 執行正則匹配preg_match($pattern, $dxycontent, $match);//var_dump($match[0]);//$match[0] 即爲<div class="yt-goods-nav">和<div class="pagination">之間的全部源碼// 匹配全部的imgpreg_match_all('/<img.+src=\"?(.+\.(jpg|gif|bmp|bnp|png))\"?.+>/i', $match[0],$matches);//帶引號$new_arr=array_unique($matches[0]);//去除數組中重複的值//foreach($new_arr as $key) {// strip_tags($key);// 因爲這個網站的路徑的域名被隱藏 因此直接替換/爲域名/ echo preg_replace('#src="/#is', 'src="http://aihuinong.com/', $key); echo "</br>";}
今天閒來無事,因而玩玩正則。扒一扒本身公司網站上的圖片。
代碼裏面的註釋寫的很清楚了。