Python爬取知乎單個問題下的回答

前言

本文的文字及圖片來源於網絡,僅供學習、交流使用,不具備任何商業用途,版權歸原做者全部,若有問題請及時聯繫咱們以做處理。json

做者: 努力學習的渣渣哦瀏覽器

PS:若有須要Python學習資料的小夥伴能夠加點擊下方連接自行獲取網絡

http://note.youdao.com/noteshare?id=3054cce4add8a909e784ad934f956cef學習

步驟:網站

  1. 打開須要獲取的問題,F12,找到回答的想要數據的API,就是jsonurl

  2. 由於知乎下拉知乎頁面,上方的url不會變化,動態加載的網站咱們通常使用抓包,拼接urlspa

  3. 完善程序orm

一. 選題:【如何看待上海新推行的垃圾分類辦法?】blog

在這裏插入圖片描述

二. 【F12】——【尋找含有文本數據的URL】圖片

  1. 如圖:依次點開【Network】——【XHR】,咱們找到【ansers?include=data%.........】,點開【preview】看到裏面的【data】數據,點開就是咱們須要的回答信息。 在這裏插入圖片描述

  2. 點到【Header】——【Request URL】,打開該網址。(建議用火狐瀏覽器打開,json格式比較規範),找到這個就跟【獲取微博】的方法同樣了,只須要讀取json文件裏面的內容就行了。 在這裏插入圖片描述

  3. 【拼接url】 多找幾個,發現只有後面offset不同。【topics&limit=5&offset=10&platform=desktop&sort_by=default】 url = 'xxxxxx.topics&offset={}&limit=20&sort_by=created'.format((i-1)*20)' 在這裏插入圖片描述

  4. 三. 輸出結果

  5. 先輸出 json,看看有沒有獲取到

在這裏插入圖片描述

2 . 完整輸出

在這裏插入圖片描述

結束:此處我只獲取了【回答的內容】,json裏面包含不少信息,如評論時間、暱稱等這些,有須要的按照上述方法獲取就能夠了

相關文章
相關標籤/搜索