用Python抓取網頁並解析

時間 2019-11-06

標籤 python 抓取網頁並解欄目 Python 简体版

原文原文鏈接

軟件版本html

python:2.7.12html5

網頁抓取庫python

網頁抓取庫爲requests,git

安裝很簡單，直接使用pipcode

pip install requests

網頁解析庫xml

網頁解析庫使用beautifulsoup4,其支持多種html解析器，如html5lib,lxml，須要一併安裝，推薦使用lxml網頁解析器。htm

安裝過程以下：blog

pip install beautifulsoup4
pip install lxml
pip install html5lib

使用方法：

soup = BeautifulSoup(html_content, "lxml", from_encoding="utf-8")

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。