Python中,專門用於HTML/XML解析的庫;html
特色是:python
即便是有bug,有問題的html代碼,也能夠解析。bash
BeautifulSoup主要有兩個版本spa
以前的,比較早的,是3.x的版本。code
最新的,可用的,在線文檔是:htm
http://www.crummy.com/software/BeautifulSoup/bs3/documentation.html文檔
中文版的是:get
http://www.crummy.com/software/BeautifulSoup/bs3/documentation.zh.htmlit
http://www.crummy.com/software/BeautifulSoup/bs3/download//3.x/io
中能夠下載到不少版本,好比我經常使用的3.0.6的版本:
http://www.crummy.com/software/BeautifulSoup/bs3/download//3.x/BeautifulSoup-3.0.6.py
最新的v4版本的BeautifulSoup,更名爲bs4了。
注意:
使用bs4時,導入BeautifulSoup的寫法是:
from
bs4
import
BeautifulSoup
http://www.crummy.com/software/BeautifulSoup/bs4/doc/
http://www.crummy.com/software/BeautifulSoup/bs4/download/
能夠下載到對應的bs4的版本,好比:
此時最新的版本是:
http://www.crummy.com/software/BeautifulSoup/bs4/download/beautifulsoup4-4.1.3.tar.gz
3.0.6以前,都是不須要安裝的,因此使用起來最簡單,直接下載對應的版本,好比:
http://www.crummy.com/software/BeautifulSoup/bs3/download//3.x/BeautifulSoup-3.0.6.py
獲得了BeautifulSoup-3.0.6.py,而後更名爲:BeautifulSoup.py
而後,放到和你當前的python文件同目錄下,好比我當前python文件是:
D:\tmp\tmp_dev_root\python\beautifulsoup_demo\beautifulsoup_demo.py
那就放到
D:\tmp\tmp_dev_root\python\beautifulsoup_demo\
下面,和beautifulsoup_demo.py同目錄。
關於如何安裝一個Python的第三方模塊,簡單說就是,進入對應目錄,運行:
setup.py
install
詳細解釋可參考: