python學習筆記(BeautifulSoup4)

BeautifulSoup4是一個從html或者xml中提取數據的py庫。 lxml是局部遍歷,BS是基於HTML DOM的,會載入整個文檔,解析整個DOM樹,時間和空間都會大很多。 #創建BS對象 soup = BeautifulSoup(html) #格式化打印出整個soup對象的內容 print ( soup.prettify()) 1.Tag 就是html中的一個個標籤 tag有兩個重要的
相關文章
相關標籤/搜索