Python新手爬蟲,簡單製作抓取廖雪峯教程的小爬蟲

先看幾張對比圖,分別是官網截圖和抓取下來的 txt文檔的截圖,不算那難看的排版的話,內容是一致的,圖片用 url替換了! 在整個抓取過程中,除了普通的文本以外,還需要處理 3個地方,分別是:代碼、圖片、視頻,因爲目前只寫到了文本文件,所以直接抓到圖片或者視頻的地址,標識清楚後寫入到 txt,這裏可以在進一步,寫到 word/pdf 或者其他文件,留待以後改進! Python 數據處理 Python
相關文章
相關標籤/搜索