正則表達式(五)-網頁爬蟲

網絡爬蟲:(蜘蛛) 所謂的網絡爬蟲就是一段小程序,從網絡中把特定的字段爬取下來 你比如說爬郵箱地址.先把整個網頁的所有的程序都下載下來放在一個str中.然後按照郵箱的正則表達式規則,對這個str進行提取.將所有的郵箱地址都提取出來 開發過程: 要想進行信息的爬蟲,你首先得有數據源啊.圖1,所示,就是畢老師使用的數據源 方法1,已經把網頁中的內容存到文件中了 package zhengze; imp
相關文章
相關標籤/搜索