Python3 爬蟲(七) -- 配置BeautifulSoup4+lxml+html5lib

序 Beautiful Soup 是一個可以從HTML或XML文件中提取數據的Python庫.它能夠通過你喜歡的轉換器實現慣用的文檔導航,查找,修改文檔的方式.Beautiful Soup會幫你節省數小時甚至數天的工作時間。 Beautiful Soup支持Python標準庫中的HTML解析器,還支持一些第三方的解析器,其中一個是 lxml 。 另一個可供選擇的解析器是純Python實現的 htm
相關文章
相關標籤/搜索