個人網站:www.liunian.online (流年在線vip視頻解析)html
空間到期沒錢續費已關閉 (。•́︿•̀。),等有錢吃飯了再買。當初建這個網站就是爲了熟悉一下建站過程,用的解析接口都是從別人的網站拿的,源碼也是從網上下載的233333333api
正文:app
想動手寫一個爬取接口的爬蟲,練練手。ide
不寫不知道,一寫嚇一跳,動手能力確實差,之後仍是要多寫多練!優化
附上代碼:網站
1 import requests 2 from bs4 import BeautifulSoup 3 4 def get_htmltext(url): 5 try: 6 kv = {'user-agent':'mozilla/5.0'} 7 r = requests.get(url,headers=kv,timeout=30) 8 r.raise_for_status() 9 r.encoding = r.apparent_encoding 10 return r.text 11 except: 12 return '' 13 14 def get_api(html,ulist): 15 soup = BeautifulSoup(html,'html.parser') 16 op = soup.find_all('option') 17 for tag in op: 18 ulist.append(tag.attrs['value']) 19 20 def save_api(ulist,path): 21 with open(path,'a') as f: 22 f.write('\n'+'---------(這次爬取接口以下)------------------------') 23 for api in ulist: 24 f.write('\n'+ api + '\n') 25 f.close() 26 27 def main(): 28 info = [] 29 save_path = 'D://videoapi.txt' 30 url = 'http://' + input("輸入要爬取的視頻解析網站的網址:") 31 html = get_htmltext(url) 32 get_api(html,info) 33 save_api(info,save_path) 34 35 main()
目瞪狗呆:原來會自動建立video.txt文件,原來。。。url
代碼還有不少能夠優化的地方,先這樣吧,我要去上課啦 ε=ε=ε=┌( ´°ェ°)┘spa