python學習筆記（BeautifulSoup4）

時間 2020-12-27

原文原文鏈接

BeautifulSoup4是一個從html或者xml中提取數據的py庫。 lxml是局部遍歷，BS是基於HTML DOM的，會載入整個文檔，解析整個DOM樹，時間和空間都會大很多。 #創建BS對象 soup = BeautifulSoup(html) #格式化打印出整個soup對象的內容 print ( soup.prettify()) 1.Tag 就是html中的一個個標籤 tag有兩個重要的

>>阅读原文<<