python-34:極視界爬蟲總結

咱們的第二個例子到這裏也要結束了,相對於第一個來講,這個實例更加深刻,涉及到了更多的模塊和方法,可是經過一步步的實踐下來,你會發現這其實不難,由於咱們有不少的網上的資源,你只要知道你想要作什麼,你不清楚什麼而後一個一個的去查就好了,這是一種獲取知識的方法,方法遠比知識重要,我但願你們能在拿到一個實例,一道題目,一個項目或者遇到什麼問題以前,先想清楚,把大的問題分紅一個個小的問題,而後解決小問題,最後再彙總成大問題的解決方案

好了,來看看咱們第二個實例用到了什麼新的知識
    1. 爲了建立保存圖片的文件夾,咱們引入了 os 模塊
        os 模塊能讓咱們使用計算機系統中的一些命令
    2. 爲了實現圖片下載的功能,咱們引入了 urllib 模塊
        跟 urllib2 同樣,urllib 是 python 自帶的一個模塊,它能被調用來實現某些功能
        
既然講到這裏,那咱們就來講說 python 中的模塊
模塊是 python 中的一個很重要的概念,若是感興趣的話,能夠去查看 python 的官方文檔:http://python.usyiyi.cn/python_278/tutorial/index.html
這裏順便推薦一些我使用的書籍和網站,書籍會放到網盤中而且不斷更新
1. python 中文官方文檔庫:http://python.usyiyi.cn/
1. python 中文官方教程:http://python.usyiyi.cn/python_278/tutorial/index.html
2. 菜鳥教程網:http://www.runoob.com/python/python-tutorial.html
3. 廖雪峯python教程:http://www.liaoxuefeng.com/wiki/001374738125095c955c1e6d8bb493182103fac9270762a000
4. 書籍網盤連接:

這是我經常使用到的一些網站,主要用來查看python的一些基礎語法,或者是一些知識概念我不是很理解的時候加深學習,有時也會做爲一些拓展給有興趣的人看,後面的學習確定也會遇到一些好的網站,到時候我會一一貼出來
    
說回模塊,這裏我依然不想把教程裏的概念搬出來,裏面的東西講得很拗口,一些專業術語會給咱們的理解帶來困難,我最多看10行就看不下去了,並且我以爲如今還不是時候,咱們目前只須要知道我要實現什麼東西,爲了實現這個,我須要用到什麼模塊,因此用個人話來講,模塊是一個能讓你實現某些功能的工具集。
就拿urllib2這個模塊來講,這個模塊能讓我實現爬取網絡資源的功能,它的實現的方式是我要調用這個模塊裏面的一些方法,好比使用urllib2.Rquest() 方法來構造請求,使用 urllib2.urlopen() 來發送請求打開網頁,這每個方法都是一個工具,能讓我實現不一樣的功能,因此說,這整個模塊就是一個工具集

python 中的模塊是很是多並且全面的,python程序實際上就是使用各類模塊來實現本身想要的功能,曾經看到過一句話,大意是說,python之因此那麼好用,就是由不少的模塊支撐起來的,因此學python不學習這些模塊的使用,至關與白學。

關於各個模塊,python都會有相應的文檔,包括模塊的功能,裏面的方法,使用的例子等等,這些完善的社區和線上資源是學習python很好的工具,你們應該多嘗試學習這些文檔

到目前爲止,咱們使用到的模塊有4個,正則表達式模塊 re,系統模塊 os,網絡模塊 urllib 和 urllib2
re 和 os 模塊咱們這裏不作過多的描述,咱們主要講一下爬蟲的核心 urllib 和 urllib2 模塊


html

相關文章
相關標籤/搜索