Python爬蟲入門教程18：好看視頻的爬取

時間 2021-02-19

標籤 python json api 網絡多線程 ide 學習網站 url 欄目 Python 简体版

原文原文鏈接

前言💨

本文的文字及圖片來源於網絡,僅供學習、交流使用,不具備任何商業用途,若有問題請及時聯繫咱們以做處理。python

前文內容💨

Python爬蟲入門教程01：豆瓣Top電影爬取json

Python爬蟲入門教程02：小說爬取api

Python爬蟲入門教程03：二手房數據爬取網絡

Python爬蟲入門教程04：招聘信息爬取多線程

Python爬蟲入門教程05：B站視頻彈幕的爬取ide

Python爬蟲入門教程06：爬取數據後的詞雲圖製做學習

Python爬蟲入門教程07：騰訊視頻彈幕爬取網站

Python爬蟲入門教程08：爬取csdn文章保存成PDFui

Python爬蟲入門教程09：多線程爬取表情包圖片url

Python爬蟲入門教程10：彼岸壁紙爬取

Python爬蟲入門教程11：新版王者榮耀皮膚圖片的爬取

Python爬蟲入門教程12：英雄聯盟皮膚圖片的爬取

Python爬蟲入門教程13：高質量電腦桌面壁紙爬取

Python爬蟲入門教程14：有聲書音頻爬取

Python爬蟲入門教程15：音樂網站數據的爬取

Python爬蟲入門教程17：音樂歌曲的爬取

PS：若有須要 Python學習資料 以及 解答 的小夥伴能夠加點擊下方連接自行獲取
python免費學習資料以及羣交流解答點擊便可加入

基本開發環境💨

Python 3.6
Pycharm

相關模塊的使用💨

import os
import requests

安裝Python並添加到環境變量，pip安裝須要的相關模塊便可。

1、💥肯定需求

爬取搞笑趣味欄目的視頻內容。

2、💥網站數據分析

首先須要明確一點，好看視頻網站加載方式是懶加載的方式，須要你下滑網頁纔會加載出新的內容

加載出來的內容裏面有音頻播放地址以及標題。

內容比較簡單，看代碼就行

import os
import requests

url = 'https://haokan.baidu.com/videoui/api/videorec?tab=gaoxiao&act=pcFeed&pd=pc&num=20&shuaxin_id=1612592171486'
headers = {
    'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36'
}
response = requests.get(url=url, headers=headers)
json_data = response.json()
videos = json_data['data']['response']['videos']
for index in videos:
    title = index['title']
    play_url = index['play_url']
    video_content = requests.get(url=play_url, headers=headers).content
    path = 'video\\'
    if not os.path.exists(path):
        os.mkdir(path)
    with open(path + title + '.mp4', mode='wb') as f:
        f.write(video_content)
        print('正在保存：', title)

相關文章

相關標籤/搜索

爬蟲－反爬蟲

Python爬蟲教學

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。

最新文章

本站公眾號

歡迎關注本站公眾號,獲取更多信息

相關文章

>>更多相關文章<<