爬蟲練手——使用Beautiful Soup、XPath分別獲取丁香園論壇回覆內容

簡單整點吧 簡單的說,Beautiful Soup就是Python的一個html或xml的解析庫,可以用來從網頁中提取數據。 BeautifulSoup在解析時實際上以來解析器,它除了支持Python標準庫中的html解析器外,還支持一些第三方解析器(比如lxml)。用法介紹就看文檔和一些書籍就好了,推薦崔慶才的《 Python3網絡爬蟲開發實戰》。 再說說XPath,全稱是XML Path La
相關文章
相關標籤/搜索