爬蟲--1

Python非常適合用來開發網頁爬蟲,理由如下: 1、抓取網頁本身的接口 相比與其他靜態編程語言,如java,c#,c++,python抓取網頁文檔的接口更簡潔;相比其他動態腳本語言,如perl,shell,python的urllib包提供了較爲完整的訪問網頁文檔的API。(當然ruby也是很好的選擇) 此外,抓取網頁有時候需要模擬瀏覽器的行爲,很多網站對於生硬的爬蟲抓取都是封殺的。這是我們需要模
相關文章
相關標籤/搜索