動態網頁信息爬取

時間 2020-12-25

原文原文鏈接

第一篇博客，以爬蟲開頭，雖然以前也學過爬蟲，但是時間比較久，現在又重新撿起，今天談談動態網頁信息的爬取。首先介紹一下爬取網頁信息的基本思路：1.使用爬蟲請求網頁，獲取網頁的源代碼 2.解析源代碼，在源代碼中找到自己想要的信息；3.若還有url地址，再次請求，重複1和2兩個步驟。找到我們所要信息的url，而有些url並不是我們所要信息的真實url，查看源代碼時不能找到所要的數據，這是因爲這部分信