2.爬蟲前奏——爲什麼學習爬蟲?

我們來解答上一次提出的問題:爲什麼花費這麼大力氣去html頁面提取信息幹什麼?還不如直接打開原始頁面進行復制粘貼呢,這不是一樣的嗎? 第一點:個人複製粘貼的話,一個網頁還好,十個網頁也還行吧,但是一百個,一千個甚至更多呢?所以說,人力是不足以完成這個工作的。因此需要爬蟲的參與。 第二點:爬蟲模擬的是人的狀態。比如,我想要進行復制粘貼所有的影評信息,是不是應該按順序打開每一個的影評頁面呢?舉一個例子
相關文章
相關標籤/搜索