個人第一個爬蟲程序:利用Python抓取網頁上的信息

題外話編程

我第一次據說Python是在大二的時候,那個時候C語言都沒有學好,因而就沒有心思學其餘的編程語言。如今,個人畢業設計要用到爬蟲技術,在網上搜索了一下,Python語言在爬蟲技術這方面得到一致好評。小程序

因此從昨天開始就在網上查找各類Python爬蟲小程序的源碼,但是一天過去了,不只沒有寫出一個簡單的爬蟲程序,反而對Python要引入的各類包和語法愈來愈迷糊了。去菜鳥教程一看,Python語言相對來說仍是蠻複雜的(雖然它的語法很簡單,可是對於初學者,不少封裝在一個包裏的東西都很是陌生),我惡補了一下Python的語法,而後又開始在網上搜尋各類教程,總之把別人寫的爬蟲入門級程序都敲了一遍,但是仍是無一奏效,有各類各樣的錯誤。編程語言

但是,今天發現一篇博客,博主很細心的講了最簡單的爬蟲有哪些步驟,用到哪些包,包括源碼都一句一句進行了分析,因而個人第一個爬蟲程序就成功了。下面分享一下這位博主的博客,並寫下本身的感覺。搜索引擎

博客地址:Python入門(一):爬蟲基本結構&簡單實例spa

 

個人實踐.net

下面這張圖片就是我按照那位博主的代碼,獲得的結果。雖然過程當中出了一點語法錯誤(徹底是我本身的失誤),但結果仍是成功的得到了網頁上的數據,還進行了篩選,並答應了出來。固然打出來的數據有不少,我只截了一小部分。你們看到的最後一個>>>後面的語句for循環語句塊,就是將要進行迭代並打印迭代器的內容,這裏就不放圖了。設計

最後的結果就是,全部人的數據都打印出來了。blog

個人感覺就是:Python能作不少事情,搜索引擎就是很大程度上利用了爬蟲程序。教程

相關文章
相關標籤/搜索