Python網絡爬蟲：利用BeautifulSoup爬取‘豆瓣讀書’中的‘新書速遞’條目

時間 2019-12-05

標籤 python 網絡爬蟲利用 beautifulsoup 豆瓣讀書新書速遞條目欄目 Python 简体版

原文原文鏈接

上一節用了正則表達式進行爬蟲，那個方法關鍵在於正則表達式（Regular Expression以後簡稱RE）的書寫，個人猜測是會有一些要提取的內容的RE寫起來會很複雜，甚至很難寫出來（固然，只是個人猜測，作的爬蟲並很少），因此利用BeautifulSoup（以後簡稱BS）就不用寫那些複雜的RE了，BS更多用到了一些屬性，好比典型的find()、find_all()（這讓我想起re裏的findall

>>阅读原文<<