Python爬蟲一一第2章、數據抓取

我們需要讓這個爬蟲從每個網頁中抽取一些數據,然後實現某些事情,這種做法也被稱爲抓取(scraping) 2.1 分析網頁 右鍵單擊選擇View page source選項,獲取網頁源代碼 2.2 三種網頁抓取方法 2.2.1 正則表達式 當我們使用正則表達式獲取面積數據時,首先需要嘗試匹配<td>元素中爲w2p_fw的內容,如下所示: 實現代碼如下: #!/usr/bin/env python3
相關文章
相關標籤/搜索