cURL 是一個功能強大的PHP庫,使用PHP的cURL庫能夠簡單和有效地抓取網頁並採集內容,設置cookie完成模擬登陸網頁,curl提供了豐富的函數,開發者能夠從PHP手冊中獲取更多關於cURL信息。php
此方式模擬的是form表單的提交,對於模擬ajax表單的提交尚未嘗試。web
<?php //模擬登陸 function login_post($url, $cookie, $post) { $curl = curl_init();//初始化curl模塊 curl_setopt($curl, CURLOPT_URL, $url);//登陸提交的地址 curl_setopt($curl, CURLOPT_HEADER, 0);//是否顯示頭信息 curl_setopt($curl, CURLOPT_RETURNTRANSFER, 0);//是否自動顯示返回的信息 curl_setopt($curl, CURLOPT_COOKIEJAR, $cookie); //設置Cookie信息保存在指定的文件中 curl_setopt($curl, CURLOPT_POST, 1);//post方式提交 curl_setopt($curl, CURLOPT_POSTFIELDS, http_build_query($post));//要提交的信息 curl_exec($curl);//執行cURL curl_close($curl);//關閉cURL資源,而且釋放系統資源 } //登陸成功後獲取數據 function get_content($url, $cookie) { $ch = curl_init(); curl_setopt($ch, CURLOPT_URL, $url); curl_setopt($ch, CURLOPT_HEADER, 0); curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1); curl_setopt($ch, CURLOPT_COOKIEFILE, $cookie); //讀取cookie $rs = curl_exec($ch); //執行cURL抓取頁面內容 curl_close($ch); return $rs; } //設置post的數據 $post = array ( 'email' => '賬號', 'password' => '密碼', 'origURL' => 'http://www.renren.com/home', 'domain' => 'renren.com', 'key_id' => '1', 'captcha_type' => 'web_login', ); //登陸地址 $url = "http://www.renren.com/PLogin.do"; //設置cookie保存路徑 $cookie = dirname(__FILE__) . '/cookie_jb51.txt'; echo $cookie; //登陸後要獲取信息的地址 $url2 = "http://zhibo.renren.com/top"; //模擬登陸 login_post($url, $cookie, $post); //獲取登陸頁的信息 $content = get_content($url2, $cookie); //刪除cookie文件 //@ unlink($cookie); file_put_contents("./junjun.txt" , $content); echo $content; //匹配頁面信息 /*$preg = "/<td class='portrait'>(.*)<\/td>/i"; preg_match_all($preg, $content, $arr); $str = $arr[1][0]; //輸出內容 echo $str;*/ ?>