網絡爬蟲入門

一: Urllib的基礎使用 Urllib模塊 urllib它是Python的內置的Htpp請求庫,有四個模塊 1.request : 它是最基本的HTTP請求模塊,可以用來模擬發送請求 2.error: 異常處理模塊。 3.parse:一個工具模塊,提供了許多URL處理方法 4.robotparser: 主要是用來識別網站的robots.txt文件,然後來判斷哪些網站可以爬…等 發送請求 url
相關文章
相關標籤/搜索