動態網頁信息爬取

第一篇博客,以爬蟲開頭,雖然以前也學過爬蟲,但是時間比較久,現在又重新撿起,今天談談動態網頁信息的爬取。 首先介紹一下爬取網頁信息的基本思路:1.使用爬蟲請求網頁,獲取網頁的源代碼 2.解析源代碼,在源代碼中找到自己想要的信息;3.若還有url地址,再次請求,重複1和2兩個步驟。 找到我們所要信息的url,而有些url並不是我們所要信息的真實url,查看源代碼時不能找到所要的數據,這是因爲這部分信
相關文章
相關標籤/搜索