正則表達式總結

爲什麼要學正則表達式 實際上爬蟲一共就四個主要步驟: 明確目標 (要知道你準備在哪個範圍或者網站去搜索) 爬 (將所有的網站的內容全部爬下來) 取 (去掉對我們沒用處的數據) 處理數據(按照我們想要的方式存儲和使用) 我們在昨天的案例裏實際上省略了第3步,也就是"取"的步驟。因爲我們down下了的數據是全部的網頁,這些數據很龐大並且很混亂,大部分的東西使我們不關心的,因此我們需要將之按我們的需要過
相關文章
相關標籤/搜索