Python爬蟲瞭解

定義:網絡爬蟲(又被稱爲網頁蜘蛛,網絡機器人,在FOAF社區中間,更經常的稱爲網頁追逐者),是一種按照一定的規則,自動地抓取萬維網信息的程序或者腳本。另外一些不常使用的名字還有螞蟻、自動索引、模擬程序或者蠕蟲。           由於專門用於檢索信息的「機器人」程序象蜘蛛一樣在網絡間爬來爬去,因此,搜索引擎的「機器人」程序就被稱爲「蜘蛛」程序。 爬蟲的由來  隨着網絡的發展,萬維網成爲大量信息的
相關文章
相關標籤/搜索