python網絡爬蟲學習筆記(二):爬蟲基本概述

1.爬蟲的基本概述 (1) 獲取網頁 爬蟲首先要做的工作就是獲取網頁,這裏就是獲取網頁的源代碼。源代碼裏包含了網頁的部分有用信息,所以只要把源代碼獲取下來,就可以從中提取想要的信息了。 python提供了許多庫來幫助我們實現這個操作,如urllib、requests等。我們可以用這些庫來幫助我們實現HTTP請求操作,請求和響應都可以用類庫提供的數據結構來表示,得到響應之後只需要解析數據結構中的Bo
相關文章
相關標籤/搜索