Python爬蟲學習筆記（一、準備工作）

時間 2020-12-30

原文原文鏈接

基本流程準備工作通過瀏覽器查看分析網頁，學習編程基礎規範。獲取數據通過HTTP庫向目標站點發起請求，請求可以包含額外header等信息，如果服務器能正常響應，會得到一個Response，獲取頁面內容。解析內容得到的內容可能爲HTML、json等格式，可以用頁面解析庫、正則表達式等進行解析。保存數據可以保存爲文本，也可以保存到數據庫。任務爬取豆瓣電影Top250的基本信息。 ht

>>阅读原文<<