網絡爬蟲實戰2——BeautifulSoup基礎操作

時間 2021-01-10

原文原文鏈接

一、介紹爬蟲的第一步，獲取整個網頁的HTML信息，我們已經完成（上一篇博文：http://blog.csdn.net/vinsuan1993/article/details/79367192）。接下來就是爬蟲的第二步，解析HTML信息，提取我們需要的內容。對於本小節的實戰，我們需要提取新聞的標題、URL地址和時間。提取的方法有很多，例如使用正則表達式、Xpath、Beautif

>>阅读原文<<