我是一隻小小爬蟲(Python編程)--第1節 什麼是爬蟲

1、爬蟲的基本概念 爬蟲:一隻在網絡上爬行的「蜘蛛」,這隻蜘蛛用來在網絡上爬取咱們想獲取的信息,因此爬蟲的定義大概是:html 請求網站並提取數據的自動化程序。git 從定義中能夠看出,咱們首先要作的是向網站發送請求,模擬瀏覽器瀏覽網頁的模式,從而獲取數據,此時獲取的數據實際上是html代碼文本以及圖片等,接下來就是篩選咱們須要的數據,梳理好咱們須要的數據以後,就是要分類,按需存儲咱們的想要的數據
相關文章
相關標籤/搜索