Python爬蟲學習筆記(一、準備工作)

基本流程 準備工作 通過瀏覽器查看分析網頁,學習編程基礎規範。 獲取數據 通過HTTP庫向目標站點發起請求,請求可以包含額外header等信息,如果服務器能正常響應,會得到一個Response,獲取頁面內容。 解析內容 得到的內容可能爲HTML、json等格式,可以用頁面解析庫、正則表達式等進行解析。 保存數據 可以保存爲文本,也可以保存到數據庫。 任務 爬取豆瓣電影Top250的基本信息。 ht
相關文章
相關標籤/搜索