好了,如今開始來認真的學習BS4,我以爲學習應該是快樂的一件事情,尤爲是在你學習一個新知識的時候,我不喜歡那些專業性很強的文檔或者教程,裏面的名詞我看都看不懂,怎麼去學習這門知識,因此,我但願能來一個簡單的,快速的,無痛的入門html
既然說是簡單的入門,因此我只打算講兩個問題,如何使用BS4和怎麼使用咱們的文檔工具
如何使用BS4,首先先來看看官方文檔上的說明
學習
將一段文檔傳入BeautifulSoup 的構造方法,就能獲得一個文檔的對象, 能夠傳入一段字符串或一個文件句柄.code
from bs4 import BeautifulSoup soup = BeautifulSoup(open("index.html")) soup = BeautifulSoup("<html>data</html>")
這幾句話很重要,它是將一段文字或者什麼東西轉換爲BeautifulSoup的一個實例,有了這個實例,咱們才能進行後續的各類操做,那咱們如今就來詳細的看一看這幾句話吧htm
1.要使用BS4,首先固然是引入這個模塊,下面的這句話就是將模塊引入的操做對象
from bs4 import BeautifulSoup
2. 後面兩句的功能實際上是同樣的,都是傳入一個文檔或者是文字,而後獲得一個BeautifulSoup的實例,官方文檔裏也說明了,能夠傳入一段字符串或一個文件句柄教程
soup = BeautifulSoup(open("index.html")) # 傳入一個句柄 soup = BeautifulSoup("<html>data</html>") # 傳入一段字符串
其實BS4的使用就是簡單的兩句話,引入模塊,而後構造對象的實例,只要稍微記一下就能夠了,這就已經入門了,有了這個,咱們就可使用BS4的全部特性去完成你想要實現的功能,那麼,怎麼知道有哪些特性以及該怎麼去使用這些特性呢?文檔
看文檔,全部可使用的方法以及怎麼使用的例子均可以在文檔找獲得,因此,接下來的關鍵就是有一份好文檔以及正確使用文檔
字符串
2.如何使用文檔入門
關於如何使用文檔,實際上是仁者見仁智者見智的,能夠從頭至尾將整個文檔看完或者也能夠吧文檔當成一個工具箱,須要實現什麼功能再去文檔裏面尋找,我後面的內容會使用第二種方法,由於我實在是懶得看這些無趣的文檔