本文的文字及圖片來源於網絡,僅供學習、交流使用,不具備任何商業用途,若有問題請及時聯繫咱們以做處理。python
Python爬蟲入門教程08:爬取csdn文章保存成PDFui
PS:若有須要 Python學習資料
以及 解答
的小夥伴能夠加點擊下方連接自行獲取
python免費學習資料以及羣交流解答點擊便可加入
import os import requests
安裝Python並添加到環境變量,pip安裝須要的相關模塊便可。
爬取搞笑趣味欄目的視頻內容。
首先須要明確一點,好看視頻網站加載方式是懶加載的方式,須要你下滑網頁纔會加載出新的內容
加載出來的內容裏面有音頻播放地址以及標題。
內容比較簡單,看代碼就行
import os import requests url = 'https://haokan.baidu.com/videoui/api/videorec?tab=gaoxiao&act=pcFeed&pd=pc&num=20&shuaxin_id=1612592171486' headers = { 'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36' } response = requests.get(url=url, headers=headers) json_data = response.json() videos = json_data['data']['response']['videos'] for index in videos: title = index['title'] play_url = index['play_url'] video_content = requests.get(url=play_url, headers=headers).content path = 'video\\' if not os.path.exists(path): os.mkdir(path) with open(path + title + '.mp4', mode='wb') as f: f.write(video_content) print('正在保存:', title)