數據爬蟲(一):爬蟲的基本原理介紹

1、什麼是爬蟲 爬蟲:請求網站並提取數據的自動化程序css 百科:網絡爬蟲(又被稱爲網頁蜘蛛,網絡機器人,在FOAF社區中間,更常常的稱爲網頁追逐者),是一種按照必定的規則,自動地抓取萬維網信息的程序或者腳本。另一些不常使用的名字還有螞蟻、自動索引、模擬程序或者蠕蟲。html   2、爬蟲基本流程 發起請求:經過HTTP庫向目標站點發起請求,即發送一個Request,請求能夠包含額外的header
相關文章
相關標籤/搜索