大數據文摘做品,歡迎我的轉發朋友圈,自媒體、媒體、機構轉載務必申請受權,後臺留言「機構名稱+轉載」,申請過受權的沒必要再次申請,只要按約定轉載便可,但文末需放置大數據文摘二維碼。html
大數據文摘曾經推出多篇Python的文章,這裏介紹3篇,點擊文字便可閱讀python
(1)初學指南| 用Python進行網頁抓取git
(2)用Python進行數據可視化的10種方法github
(3)天龍八步 第二彈:8步從Python白丁到專家,從基礎到深度學習chrome
程序設計:劉博api
撰文:席雄芬 姚佳靈瀏覽器
隨着春節的臨近,你們都在和12306鬥智鬥勇。今天,大數據文摘推出不到100行的Python程序幫助你們來搶票。cookie
首先說明一下,咱們程序的出發點是能用機器作的事就用機器作,須要人來作的事仍是要本身來作。所以,12306上五花八門的驗證碼仍是須要你們本身動手輸入確認的。另外,本程序對容錯什麼的考慮較少,請你們見諒。網絡
咱們要用到瀏覽器chrome,尚未安裝的讀者能夠從這個下載地址下載chrome並進行安裝:http://chromedriver.storage.googleapis.com/index.html?path=2.20/,你們能夠根據本身的電腦系統選擇下載包進行安裝。若是你用的是MAC,能夠直接經過brew install chromedriver來安裝。學習
如今一切就緒,讓咱們學習一下這個Python程序。
Splinter是一個自動化測試網絡應用的Python庫。有了Splinter,就能夠將打開瀏覽器、輸入URL、填寫表單、點擊按鈕等所有操做自動化。所以,咱們須要引入這個庫。經過pip install splinter來安裝。
1 from splinter.browser import Browser
2 from time import sleep
#traceback模塊被用來跟蹤異常返回信息
3 import traceback
# 設定用戶名,密碼
4 username = u"用戶名"
5 passwd = u"密碼"
# 起始地址的cookies值要本身去找, 下面兩個分別是上海, 營口東。如何找,咱們在文#後有簡單的介紹
6 starts = u"%u4E0A%u6D77%2CSHH"
7 ends = u"%u8425%u53E3%u4E1C%2CYGT"
# 時間格式2016-02-01
8 dtime = u"2016-02-01"
# 車次,選擇第幾趟,0則從上之下依次點擊
9 order = 0
#設定乘客姓名
10 pa = u"乘客姓名"
#設定網址
11 ticket_url = "https://kyfw.12306.cn/otn/leftTicket/init"
12 login_url = "https://kyfw.12306.cn/otn/login/init"
13 initmy_url = https://kyfw.12306.cn/otn/index/initMy12306
#登陸網站
14 def login():
15 b.find_by_text(u"登陸").click()
16 sleep(3)
咱們在這裏嘗試了模擬登陸12306,獲得結果以下:
登陸頁面成功顯示!
#第17至20行代碼用於自動登陸,username是12306帳號名,passwd是12306密碼
17 b.fill("loginUserDTO.user_name", username)
18 sleep(1)
19 b.fill("userDTO.password", passwd)
20 sleep(1)
在咱們的模擬登陸中,結果以下:
成功登陸!
接下來的驗證碼仍是要你們本身動手輸入啦!聽說12306的驗證碼辨識難度堪比常識競賽。在此,大數據文摘祝你好運!
21 print u"等待驗證碼,自行輸入..."
22 while True:
23 if b.url != initmy_url:
24 sleep(1)
25 else:
26 break
#購票
27 def huoche():
28 global b
#使用splinter打開chrome瀏覽器
29 b = Browser(driver_name="chrome")
#返回購票頁面
30 b.visit(ticket_url)
如今讓咱們來看看程序運行結果
看到了嗎?網頁能正常打開!
31 while b.is_text_present(u"登陸"):
32 sleep(1)
33 login()
34 if b.url == initmy_url:
35 break
36 try:
37 print u"購票頁面..."
38 # 跳回購票頁面
39 b.visit(ticket_url)
40 # 加載查詢信息
咱們的模擬登陸中以上海爲始發站,營口東爲終點站,時間選定2016年2月1日
41 b.cookies.add({"_jc_save_fromStation": starts})
42 b.cookies.add({"_jc_save_toStation": ends})
43 b.cookies.add({"_jc_save_fromDate": dtime})
44 b.reload()
讓咱們一塊兒來看看運行結果如何?
45 sleep(2)
46 count = 0
47 # 循環點擊預訂
48 if order != 0:
49 while b.url == ticket_url:
50 b.find_by_text(u"查詢").click()
程序自動點擊查詢後,結果以下:
51 count +=1
52 print u"循環點擊查詢... 第 %s 次" % count
53 sleep(1)
54 try:
55 b.find_by_text(u"預訂")[order - 1].click()
程序自動點擊預訂後,結果以下:
哇啦!咱們成功預訂了春運車票!
56 except:
57 print u"還沒開始預訂"
58 continue
59 else:
60 while b.url == ticket_url:
61 b.find_by_text(u"查詢").click()
62 count += 1
63 print u"循環點擊查詢... 第 %s 次" % count
64 sleep(1)
65 try:
66 for i in b.find_by_text(u"預訂"):
67 i.click()
68 except:
69 print u"還沒開始預訂"
70 continue
71 sleep(1)
注意:能夠經過修改sleep的參數來調整延時, 但延時不要過低, 防止被12306網站認爲是刷票屏蔽掉.
72 b.find_by_text(pa)[1].click()
若是你運氣很差,程序會給出一個這樣的信息:
73 print u"能作的都作了.....再也不對瀏覽器進行任何操做"
若是出現這樣的信息,你也不要灰心,從新執行程序,讓好運降臨!
74 except Exception as e:
75 print(traceback.print_exc())
76 if __name__ == "__main__":
77 huoche()
小技巧:
如何在chrome中得到起始站和終點站等的cookie值?
你們能夠先登陸一下12306,輸入地點日期什麼的查詢一下,而後在chrome瀏覽器中按F12,出現以下頁面,在resource選項裏找到相應的值。
你們能夠看到對應表格中的cookie值:
_jc_save_fromeStation的值爲出發地
_jc_save_toSatation的值爲目的地
_jc_save_fromDate 出發日期
_jc_save_toDate返程日期
看到這裏,你還不快點動手搶票?
備註:程序源代碼連接在此,點擊文末「閱讀原文」便可:https://github.com/Akagi201/learning-python/blob/master/splinter/huoche.py,而且在不斷更新中。