python BeautifulSoup 介紹--安裝

Python中,專門用於HTML/XML解析的庫;html

特色是:python

即便是有bug,有問題的html代碼,也能夠解析。bash

BeautifulSoup主要有兩個版本spa

BeautifulSoup 3

以前的,比較早的,是3.x的版本。code

BeautifulSoup 3的在線文檔

最新的,可用的,在線文檔是:htm

http://www.crummy.com/software/BeautifulSoup/bs3/documentation.html文檔

中文版的是:get

http://www.crummy.com/software/BeautifulSoup/bs3/documentation.zh.htmlit

下載BeautifulSoup 3

http://www.crummy.com/software/BeautifulSoup/bs3/download//3.x/io

中能夠下載到不少版本,好比我經常使用的3.0.6的版本:

BeautifulSoup-3.0.6.py

http://www.crummy.com/software/BeautifulSoup/bs3/download//3.x/BeautifulSoup-3.0.6.py

BeautifulSoup 4:縮寫爲bs4

最新的v4版本的BeautifulSoup,更名爲bs4了。

注意:

使用bs4時,導入BeautifulSoup的寫法是:

from  bs4  import  BeautifulSoup
 

bs4的在線文檔

http://www.crummy.com/software/BeautifulSoup/bs4/doc/

 

下載bs4

http://www.crummy.com/software/BeautifulSoup/bs4/download/

能夠下載到對應的bs4的版本,好比:

此時最新的版本是:

beautifulsoup4-4.1.3.tar.gz

http://www.crummy.com/software/BeautifulSoup/bs4/download/beautifulsoup4-4.1.3.tar.gz

BeautifulSoup的用法

如何安裝BeautifulSoup

3.0.6以前:無需安裝,放到和Python文件同目錄下便可使用

3.0.6以前,都是不須要安裝的,因此使用起來最簡單,直接下載對應的版本,好比:

http://www.crummy.com/software/BeautifulSoup/bs3/download//3.x/BeautifulSoup-3.0.6.py

獲得了BeautifulSoup-3.0.6.py,而後更名爲:BeautifulSoup.py

而後,放到和你當前的python文件同目錄下,好比我當前python文件是:

D:\tmp\tmp_dev_root\python\beautifulsoup_demo\beautifulsoup_demo.py

那就放到

D:\tmp\tmp_dev_root\python\beautifulsoup_demo\

下面,和beautifulsoup_demo.py同目錄。

 

3.0.6以後:須要安裝BeautifulSoup後纔可以使用

關於如何安裝一個Python的第三方模塊,簡單說就是,進入對應目錄,運行:

setup.py  install

詳細解釋可參考:

【總結】Python安裝第三方的庫、package的方法

相關文章
相關標籤/搜索