初學探索:用Python爬取網頁上的資源

以前總是覺得,爬蟲是個很高大上的東西,就像盜取別人的數據一樣。現在才知道,爬蟲能爬到的,都是網頁上能看到的,說白了就是別人給你看的。 所謂爬蟲,就是先獲取網頁的源代碼,然後從源代碼中篩選出自己想要的資源,比如網頁上的圖片、視頻等文件,甚至網頁上的文字。接下來,我們就用Python來爬取網頁上的圖片。 首先我們先獲取網站的源碼。 初學探索:用Python爬取網頁上的資源 然後就是從萬千的源碼中解析出
相關文章
相關標籤/搜索