python——爬蟲前言

網絡爬蟲 網絡爬蟲(又稱爲網頁蜘蛛,網絡機器人,在FOAF社區中間,更經常的稱爲網頁追逐者),是一種按照一定的規則,自動地抓取萬維網信息的程序或者腳本。另外一些不常使用的名字還有螞蟻、自動索引、模擬程序或者蠕蟲。——百度百科 簡單的說,網絡爬蟲就是一小段代碼(可以稱之爲腳本)。該代碼的作用是對指定網址(URL)進行頁面信息爬取(下載),然後進行信息分析,提取有用部分信息輸出。 程序不是人類,那他怎
相關文章
相關標籤/搜索