網絡爬蟲實戰2——BeautifulSoup基礎操作

一、介紹     爬蟲的第一步,獲取整個網頁的HTML信息,我們已經完成(上一篇博文:http://blog.csdn.net/vinsuan1993/article/details/79367192)。接下來就是爬蟲的第二步,解析HTML信息,提取我們需要的內容。     對於本小節的實戰,我們需要提取新聞的標題、URL地址和時間。提取的方法有很多,例如使用正則表達式、Xpath、Beautif
相關文章
相關標籤/搜索