Python爬蟲開發從入門到實戰

時間 2020-12-30

原文原文鏈接

Python爬蟲開發從入門到實戰（微課版）第1章緒論爬蟲的主要目的是獲取網頁內容並解析。只要能達到這個目的，用什麼方法都沒有問題。關於獲取網頁，本書主要介紹了Python的兩個第三方模塊，一個是requests，另一個是爬蟲框架Scrapy。關於解析網頁內容，本書主要介紹了3種方式——正則表達式、XPath和BeautifulSoup。兩種網頁獲取方式和3種網頁解析方式可以自由搭配，隨意

>>阅读原文<<