網絡爬蟲——基礎大體結構

網絡爬蟲 爬蟲的應用領域 相關工具 一個簡單的爬蟲 方法一:python自帶的方式:urllib urlopen(url).read()表示獲取到url地址而後.decode(參數)解碼 原生方法須要用正則表達式去獲取頁面中想要的參數 方法二:第三方BeautifulSoup 須要記住的是得到網站後用content.decode()解碼 BeautifulSoup解析頁面須要將裏面參數改成lxml
相關文章
相關標籤/搜索