Python網絡爬蟲:利用BeautifulSoup爬取‘豆瓣讀書’中的‘新書速遞’條目

上一節用了正則表達式進行爬蟲,那個方法關鍵在於正則表達式(Regular Expression以後簡稱RE)的書寫,個人猜測是會有一些要提取的內容的RE寫起來會很複雜,甚至很難寫出來(固然,只是個人猜測,作的爬蟲並很少),因此利用BeautifulSoup(以後簡稱BS)就不用寫那些複雜的RE了,BS更多用到了一些屬性,好比典型的find()、find_all()(這讓我想起re裏的findall
相關文章
相關標籤/搜索