手把手教你用python搶票回家過年 !(附代碼)

首先看看如何快速查看剩餘火車票?html

 

當你想查詢一下火車票信息的時候,你還在上12306官網嗎?或是打開你手機裏的APP?下面讓咱們來用Python寫一個命令行版的火車票查看器, 只要在命令行敲一行命令就能得到你想要的火車票信息!若是你剛掌握了Python基礎,這將是個不錯的小練習。python

接口設計正則表達式

一個應用寫出來最終是要給人使用的,哪怕只是給你本身使用。因此,首先應該想一想你但願怎麼使用它?讓咱們先給這個小應用起個名字吧,既然及查詢票務信息,那就叫它tickets好了。咱們但願用戶只要輸入出發站,到達站以及日期就讓就能得到想要的信息,因此tickets應該這樣被使用:chrome

 

$ tickets from to date

 

另外,火車有各類類型,高鐵、動車、特快、快速和直達,咱們但願能夠提供選項只查詢特定的一種或幾種的火車,因此,咱們應該有下面這些選項:數據庫

  • -g   高鐵
  • -d   動車
  • -t    特快
  • -k   快速
  • -z   直達

這幾個選項應該能被組合使用,因此,最終咱們的接口應該是這個樣子的:瀏覽器

 

$ tickets [-gdtkz] from to date

 

接口已經肯定好了,剩下的就是實現它了。網絡

開發環境函數

寫Python程序的一個良好實踐是使用virtualenv這個工具建一個虛擬的環境。咱們的程序使用Python3開發,下面在你的工做目錄下建一個文件夾tickets,進去建立一個虛擬環境:工具

 

$ virtualenv -p /usr/bin/python3 venv

 

解析參數測試

Python有不少寫命令行應用的工具,如argparse, docopt, options...這裏,咱們選用docopt這個簡單易用的工具,咱們先安裝它:

 

$ pip3 install docopt

 

docopt能夠按咱們在文檔字符串中定義的格式來解析參數,在tickets.py中:

3223c1de7e093bfa95405c73c6b58480c0ea69be

下面咱們運行一下這個程序:

 

$ python3 tickets.py 上海 北京 2016-07-01

 

咱們獲得下面的參數解析結果:

2af5c810edd492cad7c022c0d96f17db8b070938

 

獲取數據

參數已經解析好了,下面就是如何獲取數據了,這也是最主要的部分。首先咱們打開12306,進入餘票查詢頁面,若是你使用chrome,那麼按F12打開開發者工具,選中Network一欄,在查詢框鍾咱們輸入上海到北京,日期2016-07-01, 點擊查詢,咱們在調試工具發現,查詢系統實際上請求了這個URL

 

https://kyfw.12306.cn/otn/lcxxcx/query?purpose_codes=ADULT&queryDate=2016-07-01&from_station=SHH&to_station=BJP

 

而且返回的是Json格式的數據!接下來問題就簡單了,咱們只須要構建請求URL而後解析返回的Json數據就能夠了。可是咱們發現,URL裏面from_station和to_station並非漢字,而是一個代號,而用戶輸入的是漢字,咱們要如何獲取代號呢?咱們打開網頁源碼看看有沒有什麼發現。

啊哈!果真,咱們在網頁裏面找到了這個連接:https://kyfw.12306.cn/otn/resources/js/framework/station_name.js?station_version=1.8955

這裏面貌似是包含了全部車站的中文名,拼音,簡寫和代號等信息, 咱們在項目目錄下將它保存爲stations.html。可是這些信息擠在一塊兒,而咱們只想要中文名和大寫字母的代號信息,怎麼辦呢?

BINGO!正則表達式,咱們寫個小腳原本匹配提取出想要的信息吧, 在parse.py中:

a13056f7ddb42730be16efa2044a6ff0f74d3c72

咱們運行這個腳本,它將以字典的形式返回全部車站和它的大寫字母代號, 咱們將結果重定向到stations.py中,

 

$ python3 parse.py > stations.py

 

咱們爲這個字典加名字,stations, 最終,stations.py文件是這樣的:

6dc1d6a584f4a1a0f29555642e27babf2fbe813a

如今,用戶輸入車站的中文名,咱們就能夠直接從這個字典中獲取它的字母代碼了:

548ea1979e36dcc88261eb1386878ff3cabb6dd1

萬事俱備,下面咱們來請求這個URL獲取數據吧!這裏咱們使用requests這個庫, 先安裝它:

 

$ pip3 install requests

 

它提供了很是簡單易用的接口,

92cef5995b4c38a7e6cdbcb549566e07b0aa85f5

從結果中,咱們能夠觀察到,與車票有關的信息須要進一步提取:

02f39e4dbaecfe3ceaf6f936bf9df7e65c7b7556

顯示結果

數據已經獲取到了,剩下的就是提取咱們要的信息並將它顯示出來。prettytable這個庫可讓咱們它像MySQL數據庫那樣格式化顯示數據。

 

$ pip3 install prettytable

 

這樣使用它:

5d9cb92e57878db1b1fe1c3b3867516aea1f8b69

其次咱們看看如何自動搶:

做者:marvin,互聯網從業者,現居上海張江

使用Python+Splinter自動刷新搶票,能夠成功搶到。(依賴本身的網絡環境太厲害,還有機器的好壞)

Splinter是一個使用Python開發的開源Web應用測試工具,它能夠幫你實現自動瀏覽站點和與其進行交互,Splinter執行的時候會自動打開你指定的瀏覽器,訪問指定的URL。而後你所開發的模擬的任何行爲,都會自動完成,你只須要坐在電腦面前,像看電影同樣看着屏幕上各類動做自動完成而後收集結果便可。

12306搶票Python代碼片斷

實現自動登陸的函數:

4f0ab29da88abc3c4cc86b1a80a2b4d0a9f144bf

開始購票的函數

1ac489d3054abd6b2b6181c03281b98b5145c1d2

閱讀原文http://click.aliyun.com/m/40595/

相關文章
相關標籤/搜索