PhantomJS實現最簡單的模擬登陸方案

之前寫爬蟲,遇到須要登陸的頁面,通常都是經過chrome的檢查元素,查看登陸須要的參數和加密方法,若是網站的加密很是複雜,例如登陸qq的,就會很蛋疼
在後面,有了Pyv8,就能夠把加密的js文件扔給它,而後返回加密後的字符串。可是Pyv8只能安裝在Centos7的版本,並且耗用內存也比較大。
如今有了PhantomJS,不再須要考慮登陸的參數和加密了,用PhantomJS打開頁面,經過JS或JQuery語句,填入帳號和密碼,而後點擊登陸,而後把Cookies保存下來,就能夠模擬登陸了。javascript

1.安裝

# yum -y install gcc gcc-c++ make flex bison gperf ruby \
  openssl-devel freetype-devel fontconfig-devel libicu-devel sqlite-devel \
  libpng-devel libjpeg-devel
# git clone git://github.com/ariya/phantomjs.git
# cd phantomjs
# git checkout 2.0
# ./build.sh

2.建立一個page實例

var page = require('webpage').create();

3.打開一個頁面

page.open('http://www.baidu.com', function() {
});

第二個參數是打開頁面後回調的函數html

4.執行js語句

page.evaluate(function() {
            $("button").click();
            console.info($("button"))
        });

包裹在evaluate裏面的js語句是在沙箱裏面運行的,沙箱的上下文環境就是open的頁面的環境,因此在這裏能夠經過js語句訪問頁面的元素,例如$("body").html()
因爲在沙箱中執行,因此console.info不會輸出的終端,若是須要輸出到終端,就要設置回調函數:java

page.onConsoleMessage = function(msg) {
    console.log(msg);
};

5.cookies

獲取頁面的cookiesc++

console.info(JSON.stringify(page.cookies))

cookies的數據結構,至關於{"age":"12"}git

[
    {
        "domain": "info.aaa.com",
        "httponly": false,
        "name": "age",
        "path": "/",
        "secure": false,
        "value": "12"
    }
]

6.截圖

page.viewportSize = { width: 1366, height: 600 };//設置頁面的尺寸
page.render('info_test.png');

若是截圖後,中文字符顯示爲方框,安裝字體庫github

yum install bitmap-fonts bitmap-fonts-cjk

7.腳本參數

var page = require('webpage').create(),
    system = require('system'),
    address, output, size;

if (system.args.length != 5) {
    console.log('Usage: test.js domain username password projects screen_shot_path ');
    phantom.exit(1);
} else {
    var domain = system.args[1]  
    var username = system.args[2] 
    var password = system.args[3] 
    var projects = system.args[4] 
    var root_shot_path = system.args[5] 
}

8.注意

  • 因爲js語言是非阻塞的,因此有時候須要使用setTimtout setInterval來等待沙箱中執行的js語句,例如等待裏面的ajax完成等。

9.簡單的模擬登陸DEMO

var page = require('webpage').create();
page.viewportSize = { width: 1366, height: 600 };
var url='http://www.mysite.com/login'
page.open(url, function() {
    ret=page.evaluate(function() {
            $("#username")[0].value='lujianxing'
            $("#password")[0].value='test'
            $("#submit").click();
        });
    setTimeout('print_cookies()',10000)
});

function print_cookies(){
    console.info(JSON.stringify(page.cookies, undefined, 4))
    phantom.exit()
}

10.命令行運行腳本

phantomjs test.js

參考
PhantomJS官網web

轉載請帶上ajax

相關文章
相關標籤/搜索