處理因爲網絡延遲形成無法找到網頁元素
php
用time
模塊不推薦使用
css
用time模塊中的time.sleep來完成等待python
from selenium import webdriver import time browser = webdriver.Chrome() response = browser.get('https://www.12306.cn/index/') #找到登入按鈕點擊 login_button_xpath = '//*[@id="J-header-login"]/a[1]' login_button = browser.find_element_by_xpath(login_button_xpath) while not login_button: login_button = browser.find_element_by_xpath(login_button_xpath) time.sleep(10) login_button.click()
implicitly_wait(隱式等待)web
隱式等待實際是設置了一個最長等待時間網絡
若是在規定時間內網頁加載完成,則執行下一步,不然一直等到時間結束,而後執行下一步。app
注意點
咱們都知道js通常都是放在咱們的body的最後進行加載,實際這是頁面上的元素都已經加載完畢,咱們卻還在等帶所有頁面加載結束。dom
隱式等待對整個driver週期都起做用,在最開始設置一次就能夠了。不要當作固定等待使用,到那都來一下隱式等待。url
#隱式等待,失敗機率高,可不用 browser.implicitly_wait(10) #在10秒內,若是網頁所有加載完成(包含js),則執行下一步,不然一直等到10秒結束後,在執行下一步
WebDriverWait(顯示等待)(推薦使用)code
from selenium.webdriver.support.wait import WebDriverWait
ci
until與until_not
until與until_not裏面的兩個參數
method的設置
必須是含有__call__
的可執行方法。因此咱們引用selenium提供的一個模塊
from selenium.webdriver.support import expected_conditions as EC
'''隱式等待和顯示等待都存在時,超時時間取兩者中較大的''' locator = (By.ID,'kw') driver.get(base_url) WebDriverWait(driver,10).until(EC.title_is(u"百度一下,你就知道")) '''判斷title,返回布爾值''' WebDriverWait(driver,10).until(EC.title_contains(u"百度一下")) '''判斷title,返回布爾值''' WebDriverWait(driver,10).until(EC.presence_of_element_located((By.ID,'kw'))) '''判斷某個元素是否被加到了dom樹裏,並不表明該元素必定可見,若是定位到就返回WebElement''' WebDriverWait(driver,10).until(EC.visibility_of_element_located((By.ID,'su'))) '''判斷某個元素是否被添加到了dom裏而且可見,可見表明元素可顯示且寬和高都大於0''' WebDriverWait(driver,10).until(EC.visibility_of(driver.find_element(by=By.ID,value='kw'))) '''判斷元素是否可見,若是可見就返回這個元素''' WebDriverWait(driver,10).until(EC.presence_of_all_elements_located((By.CSS_SELECTOR,'.mnav'))) '''判斷是否至少有1個元素存在於dom樹中,若是定位到就返回列表''' WebDriverWait(driver,10).until(EC.visibility_of_any_elements_located((By.CSS_SELECTOR,'.mnav'))) '''判斷是否至少有一個元素在頁面中可見,若是定位到就返回列表''' WebDriverWait(driver,10).until(EC.text_to_be_present_in_element((By.XPATH,"//*[@id='u1']/a[8]"),u'設置')) '''判斷指定的元素中是否包含了預期的字符串,返回布爾值''' WebDriverWait(driver,10).until(EC.text_to_be_present_in_element_value((By.CSS_SELECTOR,'#su'),u'百度一下')) '''判斷指定元素的屬性值中是否包含了預期的字符串,返回布爾值''' #WebDriverWait(driver,10).until(EC.frame_to_be_available_and_switch_to_it(locator)) '''判斷該frame是否能夠switch進去,若是能夠的話,返回True而且switch進去,不然返回False''' #注意這裏並無一個frame能夠切換進去 WebDriverWait(driver,10).until(EC.invisibility_of_element_located((By.CSS_SELECTOR,'#swfEveryCookieWrap'))) '''判斷某個元素在是否存在於dom或不可見,若是可見返回False,不可見返回這個元素''' #注意#swfEveryCookieWrap在此頁面中是一個隱藏的元素 WebDriverWait(driver,10).until(EC.element_to_be_clickable((By.XPATH,"//*[@id='u1']/a[8]"))).click() '''判斷某個元素中是否可見而且是enable的,表明可點擊''' driver.find_element_by_xpath("//*[@id='wrapper']/div[6]/a[1]").click() #WebDriverWait(driver,10).until(EC.element_to_be_clickable((By.XPATH,"//*[@id='wrapper']/div[6]/a[1]"))).click() #WebDriverWait(driver,10).until(EC.staleness_of(driver.find_element(By.ID,'su'))) '''等待某個元素從dom樹中移除''' #這裏沒有找到合適的例子 WebDriverWait(driver,10).until(EC.element_to_be_selected(driver.find_element(By.XPATH,"//*[@id='nr']/option[1]"))) '''判斷某個元素是否被選中了,通常用在下拉列表''' WebDriverWait(driver,10).until(EC.element_selection_state_to_be(driver.find_element(By.XPATH,"//*[@id='nr']/option[1]"),True)) '''判斷某個元素的選中狀態是否符合預期''' WebDriverWait(driver,10).until(EC.element_located_selection_state_to_be((By.XPATH,"//*[@id='nr']/option[1]"),True)) '''判斷某個元素的選中狀態是否符合預期''' driver.find_element_by_xpath(".//*[@id='gxszButton']/a[1]").click() instance = WebDriverWait(driver,10).until(EC.alert_is_present()) '''判斷頁面上是否存在alert,若是有就切換到alert並返回alert的內容'''
from selenium.webdriver.common.by import By
BY對於的內容
ID = "id" XPATH = "xpath" LINK_TEXT = "link text" PARTIAL_LINK_TEXT = "partial link text" NAME = "name" TAG_NAME = "tag name" CLASS_NAME = "class name" CSS_SELECTOR = "css selector"
class current_url(object): def __init__(self,current_url): self.current_url = current_url def __call__(self, driver): return self.current_url == driver.current_url
from selenium import webdriver from selenium.webdriver.support import expected_conditions as EC from selenium.webdriver.common.by import By browser = webdriver.Chrome() response = browser.get('https://www.12306.cn/index/') login_button_xpath = '//*[@id="J-header-login"]/a[1]' print(time.time()) #每1秒掃描一次,直到60秒超時後,中止 a=WebDriverWait(browser,60,1).until(EC.presence_of_element_located((By.XPATH,login_button_xpath))) login_button = browser.find_element_by_xpath(login_button_xpath) print(time.time()) login_button.click()
參考文檔:http://www.imdsx.cn/index.php/2017/07/27/ec/