Python網絡爬蟲入門筆記 八、提取信息

信息的提取有多種方法。   一、完整解析信息的標記形式,再提取關鍵信息 顧名思義,首先解析信息的標記形式,再提取需要的信息。 這種方法需要標記解析器,例如前面用到的BeautifulSoup庫提供的標籤樹遍歷。 優點:信息解析準確 缺點:提取信息繁瑣,速度慢,也要求對信息的組織形式有一定的認識和了解。   二、無視標記形式,直接搜索關鍵信息 對信息的文本查找函數即可。 優點:提取過程簡介,速度較快
相關文章
相關標籤/搜索