Python學習筆記-網絡爬蟲（二、提取）

時間 2020-12-30

原文原文鏈接

一、Beautiful Soup 1、BeautifulSoup庫基本元素 2、基於bs4庫的HTML內容遍歷方法 3、基於bs4的HTML格式化和編碼（讓HTML信息可讀性更好）二、信息組織與提取方法 1、信息標記的三種形式 2、三種信息標記形式的比較 3、信息提取的一般方法 4、基於bs4的HTML內容查找方法 find_all() find_all()第一個參數：name （re

>>阅读原文<<