爬蟲實戰篇---12306搶票爬蟲

(1)、前言

(此代碼通過個人實測具備較強的實用型)每逢佳節,你們對於回家搶票這件事是否是特別頭疼呢?今天我在網上發現了這個代碼,經過一天的學習,與你們分析下,你們能夠直接拿來進行12306搶票,也能夠進行優化,進行諸如演唱會的搶票,等等。該代碼主要使用了模擬瀏覽器方式而並無採用分析請求。html

(2)、技術路線

selenium + chromedriverpython

(3)、思路分析

一、模擬瀏覽器登陸搶票界面,手動進行登陸git

二、登陸完成後讓瀏覽器跳轉到購票界面web

三、手動輸入出發地、目的地、 出發日,檢查上面三個信息輸入完成後,找到查詢按鈕,進行車次查詢chrome

四、查找咱們須要的車次,看下是否有餘票(顯示有或數子),找到車次的預約的按鈕,進行點擊,若是沒有以上兩種狀況出現,就循環查詢windows

五、一旦檢查到有票,執行預約按鈕的點擊事件,找到乘客信息,執行點擊事件,再找到提交訂單按鈕,執行點擊事件瀏覽器

六、點擊完提交訂單按鈕,會彈出確認的對話框,找到確認按鈕,執行點擊事件,完成搶票cookie

七、以後完成付款操做ide

(4)、所有代碼

  1 #author: "xian"
  2 #date: 2018/6/9
  3 #使用selenium是不保存登陸信息的(cookies)
  4 from selenium import webdriver
  5 from selenium.webdriver.support.ui import WebDriverWait
  6 from selenium.webdriver.support import expected_conditions as EC #指望的條件
  7 from selenium.webdriver.common.by import By
  8 
  9 
 10 
 11 class Qiangpiao(object):
 12     #初始化函數
 13     def __init__(self):
 14         self.login_url = 'https://kyfw.12306.cn/otn/login/init'
 15         self.initmy_url = 'https://kyfw.12306.cn/otn/index/initMy12306'
 16         self.search_url = 'https://kyfw.12306.cn/otn/leftTicket/init'
 17         self.confirmPassenger = 'https://kyfw.12306.cn/otn/confirmPassenger/initDc'
 18         self.driver = webdriver.Chrome() #驅動chrome瀏覽器進行操做
 19 
 20     def wait_input(self):
 21         self.from_station = input('出發地:')
 22         self.to_station = input('目的地:')
 23         #時間格式必定要對應
 24         self.depart_time = input('出發時間:')
 25         #名字必定要存在於經常使用聯繫人中間
 26         self.passengers = input('乘客姓名:(若有多個乘客使用英文逗號分割)').split(',')
 27         self.trains = input('車次:(若有多個車次使用英文逗號分割)').split(',') #結果[G234,...]
 28 
 29     #_login只想在類中調用
 30     def _login(self):
 31         self.driver.get(self.login_url) #打開登陸界面
 32         #顯示等待(解釋:你與心上人約會,以對方來或不來爲等待條件即事件是否發生爲條件)
 33         #隱示等待(解釋:你與心上人約會,以等待時間爲條件)
 34         WebDriverWait(self.driver,1000).until(EC.url_to_be(self.initmy_url))
 35         print('恭喜您,您已登陸成功了!')
 36 
 37 
 38     def _order_ticket(self):
 39         #一、跳轉到查餘票的界面
 40         self.driver.get(self.search_url)
 41         #二、等待出發地是否輸入正確
 42         WebDriverWait(self.driver ,1000).until(EC.text_to_be_present_in_element_value((By.ID,"fromStationText"),self.from_station))
 43         #三、等待目的地是都輸入正確
 44         WebDriverWait(self.driver, 1000).until(EC.text_to_be_present_in_element_value((By.ID,"toStationText"),self.to_station))
 45         #四、等待出發日期是否輸入正確
 46         WebDriverWait(self.driver, 1000).until(EC.text_to_be_present_in_element_value((By.ID,"train_date"),self.depart_time))
 47         #五、等待查詢按鈕是否可用
 48         WebDriverWait(self.driver, 1000).until(EC.element_to_be_clickable((By.ID, "query_ticket")))
 49         #六、若是能夠點擊找到查詢按鈕執行點擊事件
 50         searchBotton = self.driver.find_element_by_id("query_ticket")
 51         searchBotton.click()
 52         #七、點擊查詢按鈕以後等待車票信息頁面被加載完成
 53         WebDriverWait(self.driver, 1000).until(EC.presence_of_element_located((By.XPATH,".//tbody[@id = 'queryLeftTable']/tr")))
 54         #八、找到全部沒有datatrain屬性的tr標籤
 55         tr_list = self.driver.find_elements_by_xpath(".//tbody[@id ='queryLeftTable']/tr[not(@datatran)]")
 56         #九、遍歷全部知足條件的tr標籤
 57         for tr in tr_list:
 58             train_number = tr.find_element_by_class_name('number').text
 59             if train_number in self.trains:
 60                 left_ticket = tr.find_element_by_xpath('.//td[3]').text #找到第四個td標籤下的文本
 61                 if left_ticket == '' or left_ticket.isdigit: #判斷輸入的車次是否在列表中
 62                     orderBotton = tr.find_element_by_class_name('btn72')
 63                     orderBotton.click()
 64 
 65                     #等待是否來到乘客確認頁面
 66                     WebDriverWait(self.driver, 1000).until(EC.url_to_be(self.confirmPassenger))
 67                     #等待全部的乘客信息被加載完畢
 68                     WebDriverWait(self.driver, 1000).until(EC.presence_of_element_located((By.XPATH,".//ul[@id = 'normal_passenger_id']/li")))
 69                     #獲取全部的乘客信息
 70                     passanger_labels = self.driver.find_elements_by_xpath(".//ul[@id = 'normal_passenger_id']/li/label")
 71                     for passanger_label in passanger_labels: #遍歷全部的label標籤
 72                         name = passanger_label.text
 73                         if name in self.passengers:#判斷名字是否與以前輸入的名字重合
 74                             passanger_label.click() #執行點擊操做
 75 
 76                             #獲取提交訂單的按鈕
 77                             submitBotton = self.driver.find_element_by_id('submitOrder_id')
 78                             submitBotton.click()
 79                             #顯示等待確人訂單對話框是否出現
 80                             WebDriverWait(self.driver, 1000).until(EC.presence_of_element_located((By.CLASS_NAME,'dhtmlx_wins_body_outer')))
 81                             #顯示等待確認按鈕是否加載出現,出現後執行點擊操做
 82                             WebDriverWait(self.driver, 1000).until(EC.presence_of_element_located((By.ID,'qr_submit_id')))
 83                             ConBotton = self.driver.find_element_by_id('qr_submit_id')
 84                             ConBotton.click()
 85                             while ConBotton:
 86                                 ConBotton.click()
 87                                 ConBotton = self.driver.find_element_by_id('qr_submit_id')
 88 
 89                             return
 90 
 91 
 92 
 93 
 94 
 95 
 96 
 97 
 98     def run(self):
 99         self.wait_input()
100         self._login()
101         self._order_ticket()
102 
103 if __name__ == '__main__':
104     spider = Qiangpiao()
105     spider.run()

(5)、運行效果圖

以後你們只要在30分鐘以內完成在線支付便可,方便實用!函數

(6)、使用說明

請使用前確保已安裝好一個python編譯器並完成pyhon的配置windows下推薦使用pycharm,並下載chrome和chromedriver驅動,並將chromedriver配置進python包(若是沒配置只要指定路徑亦可!)

複製代碼按命令行提示操做便可完成搶票

相關文章
相關標籤/搜索