爬取視頻解析網站的解析接口

時間 2019-11-19

標籤視頻解析網站接口欄目網站開發简体版

原文原文鏈接

個人網站：www.liunian.online （流年在線vip視頻解析）html

空間到期沒錢續費已關閉 (。•́︿•̀。)，等有錢吃飯了再買。當初建這個網站就是爲了熟悉一下建站過程，用的解析接口都是從別人的網站拿的，源碼也是從網上下載的233333333api

正文：app

想動手寫一個爬取接口的爬蟲，練練手。ide

不寫不知道，一寫嚇一跳，動手能力確實差，之後仍是要多寫多練！優化

附上代碼：網站

 1 import requests
 2 from bs4 import BeautifulSoup
 3 
 4 def get_htmltext(url):
 5     try:
 6         kv = {'user-agent':'mozilla/5.0'}
 7         r = requests.get(url,headers=kv,timeout=30)
 8         r.raise_for_status()
 9         r.encoding = r.apparent_encoding
10         return r.text
11     except:
12         return ''
13 
14 def get_api(html,ulist):
15     soup = BeautifulSoup(html,'html.parser')
16     op = soup.find_all('option')
17     for tag in op:
18         ulist.append(tag.attrs['value'])
19 
20 def save_api(ulist,path):
21     with open(path,'a') as f:
22         f.write('\n'+'---------(這次爬取接口以下)------------------------')
23         for api in ulist:
24             f.write('\n'+ api + '\n')
25         f.close()
26 
27 def main():
28     info = []
29     save_path = 'D://videoapi.txt'
30     url = 'http://' + input("輸入要爬取的視頻解析網站的網址：")
31     html = get_htmltext(url)
32     get_api(html,info)
33     save_api(info,save_path)
34 
35 main()

目瞪狗呆：原來會自動建立video.txt文件，原來。。。url

代碼還有不少能夠優化的地方，先這樣吧，我要去上課啦 ε=ε=ε=┌( ´°ェ°)┘spa

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。