安裝beautifulsoup庫時遇到麻煩

1、Beautiful Soup庫遇到的問題

       1.ImportError: No module named BeautifulSoup       

當你成功安裝BeautifulSoup 4庫後,「from BeautifulSoup import BeautifulSoup」可能會遇到該錯誤。html


        其中的緣由是BeautifulSoup 4庫更名爲bs4,須要使用「from bs4 import BeautifulSoup」導入。

        2.TypeError: an integer is required

        當你使用「print soup.title.string」獲取title的值時,可能會遇到該錯誤。以下:

        它應該是IDLE的BUG,當使用命令行Command沒有任何錯誤。參考: stackoverflow。同時能夠經過下面的代碼解決該問題:
        print unicode(soup.title.string)
        print str(soup.title.string)

下載地址:https://www.crummy.com/software/BeautifulSoup/bs4/download/python

下載完成後解壓到python安裝包的地方,存放在Beautifulsoup.**文件下ide

 

win+R  ————cmd  cd (第 2 步放置安裝包的位置)C:\Python36\beautifulsoup4-4.6.0

安裝:python steup.py install

二. 安裝及介紹Beautiful Soup庫

安裝beautiful soup庫函數

#安裝
pip install beautifulsoup4
#檢查
from bs4 import Beautiful Soup
#安裝 lxml
pip install lxml
捷徑

別的就很少說了工具

pip install beautifulsoup4

安裝完成後ui

from bs4 import BeautifulSoup

進行導入模塊,若是運行沒有問題,那麼咱們就是成功了--------若是是報的‘import name HTMLParseError’,就說明咱們的python版本與beautiful soup4的支持版本不符,那麼我要更新運行beautiful soup,或者直接下載最新的(才腦袋痛哦)編碼

pip3 install --upgrade beautifulsoup4

更新完成後,那麼咱們就可使用 bs4 了,若是仍是報錯 (那麼我就進入他老巢————文件夾看看)打開 finder ,前往文件夾:spa

/usr/local/lib/python3.6/site-packages

在這個文件夾裏找一找,看有沒有兩個beautifuls4的文件,若是有,刪掉那個舊版本的,個人是不知道什麼緣由,site-packages裏多了個 ‘‘beautifulsoup4-4.1.0-py3.6.egg-info’’文件,刪除掉就行了。命令行

beautifulsoup4安裝完成以後,還須要一個叫 lxml 的依賴庫:3d

pip3 install lxml

ok,完成,個人也就是到這裏爲止了,可能還有更好的操做方法也說不定的哈,小弟課多也就再花功夫在研究咯0.....0

Beautiful Soup提供一些簡單的、python式的函數用來處理導航、搜索、修改分析樹等功能。它是一個工具箱,經過解析文檔爲用戶提供須要抓取的數據,由於簡單,因此不須要多少代碼就能夠寫出一個完整的應用程序。

Beautiful Soup自動將輸入文檔轉換爲Unicode編碼,輸出文檔轉換爲utf-8編碼。你不須要考慮編碼方式,除非文檔沒有指定一個編碼方式,這時,Beautiful Soup就不能自動識別編碼方式了。而後,你僅僅須要說明一下原始編碼方式就能夠了。

Beautiful Soup已成爲和lxml、html6lib同樣出色的python解釋器,爲用戶靈活地提供不一樣的解析策略或強勁的速度

具體的介紹咱們仍是參考官方文檔吧:
 http://www.crummy.com/software/BeautifulSoup/bs4/doc/index.zh.html

相關文章
相關標籤/搜索