Python3 爬蟲（七） -- 配置BeautifulSoup4+lxml+html5lib

時間 2020-12-30

標籤 python 欄目 Python 简体版

原文原文鏈接

序 Beautiful Soup 是一個可以從HTML或XML文件中提取數據的Python庫.它能夠通過你喜歡的轉換器實現慣用的文檔導航,查找,修改文檔的方式.Beautiful Soup會幫你節省數小時甚至數天的工作時間。 Beautiful Soup支持Python標準庫中的HTML解析器,還支持一些第三方的解析器,其中一個是 lxml 。另一個可供選擇的解析器是純Python實現的 htm

>>阅读原文<<