當你成功安裝BeautifulSoup 4庫後,「from BeautifulSoup import BeautifulSoup」可能會遇到該錯誤。html
下載地址:https://www.crummy.com/software/BeautifulSoup/bs4/download/python
下載完成後解壓到python安裝包的地方,存放在Beautifulsoup.**文件下ide
安裝beautiful soup庫函數
#安裝 pip install beautifulsoup4 #檢查 from bs4 import Beautiful Soup #安裝 lxml pip install lxml
別的就很少說了工具
pip install beautifulsoup4
安裝完成後ui
from bs4 import BeautifulSoup
進行導入模塊,若是運行沒有問題,那麼咱們就是成功了--------若是是報的‘import name HTMLParseError’,就說明咱們的python版本與beautiful soup4的支持版本不符,那麼我要更新運行beautiful soup,或者直接下載最新的(才腦袋痛哦)編碼
pip3 install --upgrade beautifulsoup4
更新完成後,那麼咱們就可使用 bs4 了,若是仍是報錯 (那麼我就進入他老巢————文件夾看看)打開 finder ,前往文件夾:spa
/usr/local/lib/python3.6/site-packages
在這個文件夾裏找一找,看有沒有兩個beautifuls4的文件,若是有,刪掉那個舊版本的,個人是不知道什麼緣由,site-packages裏多了個 ‘‘beautifulsoup4-4.1.0-py3.6.egg-info’’文件,刪除掉就行了。命令行
beautifulsoup4安裝完成以後,還須要一個叫 lxml 的依賴庫:3d
pip3 install lxml
ok,完成,個人也就是到這裏爲止了,可能還有更好的操做方法也說不定的哈,小弟課多也就再花功夫在研究咯0.....0
Beautiful Soup提供一些簡單的、python式的函數用來處理導航、搜索、修改分析樹等功能。它是一個工具箱,經過解析文檔爲用戶提供須要抓取的數據,由於簡單,因此不須要多少代碼就能夠寫出一個完整的應用程序。
Beautiful Soup自動將輸入文檔轉換爲Unicode編碼,輸出文檔轉換爲utf-8編碼。你不須要考慮編碼方式,除非文檔沒有指定一個編碼方式,這時,Beautiful Soup就不能自動識別編碼方式了。而後,你僅僅須要說明一下原始編碼方式就能夠了。
Beautiful Soup已成爲和lxml、html6lib同樣出色的python解釋器,爲用戶靈活地提供不一樣的解析策略或強勁的速度
具體的介紹咱們仍是參考官方文檔吧:
http://www.crummy.com/software/BeautifulSoup/bs4/doc/index.zh.html