Python爬蟲之爬蟲原理(2)

爬蟲的基本流程 發起請求 向目標站點發起一個http請求,請求的信息我們可以自己指定,然後等待服務器響應 獲取響應內容 如果服務器正常響應,會得到一個reponse,它裏面的內容就是服務器返回的頁面內容,類型可能是html,json字符串,二進制信息等類型 解析內容 若得到的內容是html,則可以用正則表達式和頁面解析庫(如BeautifulSoup)進行解析,若是json,可以直接轉換爲json
相關文章
相關標籤/搜索