Python爬蟲開發從入門到實戰

Python爬蟲開發從入門到實戰(微課版) 第1章 緒論 爬蟲的主要目的是獲取網頁內容並解析。只要能達到這個目的,用什麼方法都沒有問題。 關於獲取網頁,本書主要介紹了Python的兩個第三方模塊,一個是requests,另一個是爬蟲框架Scrapy。 關於解析網頁內容,本書主要介紹了3種方式——正則表達式、XPath和BeautifulSoup。兩種網頁獲取方式和3種網頁解析方式可以自由搭配,隨意
相關文章
相關標籤/搜索