python網絡爬蟲學習筆記（二）：爬蟲基本概述

時間 2021-01-07

標籤 python網絡爬蟲 python cookie http python爬蟲欄目 Python 简体版

原文原文鏈接

1.爬蟲的基本概述 (1) 獲取網頁爬蟲首先要做的工作就是獲取網頁，這裏就是獲取網頁的源代碼。源代碼裏包含了網頁的部分有用信息，所以只要把源代碼獲取下來，就可以從中提取想要的信息了。 python提供了許多庫來幫助我們實現這個操作，如urllib、requests等。我們可以用這些庫來幫助我們實現HTTP請求操作，請求和響應都可以用類庫提供的數據結構來表示，得到響應之後只需要解析數據結構中的Bo

>>阅读原文<<