這幾日一直在研究Java爬蟲,經歷了入坑又爬坑的感受,在知乎找Java爬蟲框架,找到了一款心儀的框架,並且是國人開發,瀏覽了文檔說明手冊,感受挺好上手,支持正則、jQuery、XPATH選擇語法,本身好借鑑之前使用Python Scrapy框架的經驗,一頓心裏狂喜以後,開始了正式上手Java爬蟲的計劃,閱讀到這裏,尷尬的事情出現了。git
Maven是個啥?學Java的時候怎麼沒有據說過?算了,搞吧,本身學習能力這麼強應該沒啥大問題,就在慕課網裏找到了課程刷了起來。web
看了一遍,只知道Maven是幹什麼,怎麼用是一點都不懂,在知乎裏又搜了Maven,看到有人說Maven是如何如何的了不得,但是本身絲毫沒有感到,就知道Maven的入門門檻有點高,通常課程看一遍就能明白是個啥以及大體怎麼作了,可是Maven這個課程是前先後後看了好多遍,還要邊看邊作便理解才能慢慢體會到其中的強大!框架
Maven能夠幹什麼?若是接觸過Python,學習了Maven以後發現它真的很像Pip,把別人造的輪子經過很輕鬆的方式就能夠爲你所用,學習Maven以前,各類Jar包都是獨立存在的,學過Maven以後各類Jar包都能和你產生關係,只須要喊一聲我要使用哪一個公司的哪一個版本的工具jar包,就能夠用了,不用處處找Jar包了,依賴關係也輕鬆解決,jar包的使用能夠精確的控制。工具
若是還沒聽懂,那來一個更簡單的例子,電腦下載軟件須要到各個軟件公司的官網上去下載,沒有統一的「市場」去管理,致使找個軟件可能要費不少波折,蘋果手機的App Store統一了蘋果手機應用的下載和更新,全部蘋果應用都彙總在App Store,全部裏面的應用很全面,每一個應用但按照規範定義版本號,經過App Store能夠管理應用的更新,咱們使用的時候可能渾然不知,可是想一想若是沒有這樣的方式,不少簡單的需求處理起來會變得複雜的不少,安卓早期也是如此。學習
Maven既然這麼強大,就來小窺一下。spa
按照上面手冊說明的來。在本身的項目(已有項目或者新建一個)中添加如下座標便可:3d
<dependency>
<groupId>us.codecraft</groupId>
<artifactId>webmagic-core</artifactId>
<version>0.7.3</version>
</dependency>
<dependency>
<groupId>us.codecraft</groupId>
<artifactId>webmagic-extension</artifactId>
<version>0.7.3</version>
</dependency>
複製代碼
剛開始的時候鬼知道這什麼意思哦,其實就是使用Maven定義的方式管理項目依賴。筆者使用的是IDEA集成開發環境,全部不少步驟省略了,要真正掌握Maven仍是須要都明白才行,這裏就不知一一講解了。code
粘貼進去,而後神奇的事情就會發生,哈哈哈,不買關子了,框架相關的依賴Jar包自動給咱們添加好了。cdn
看到這麼多數量的依賴,想一想沒有Maven的話,一個個去找,得多麻煩,有Maven後只是複製粘貼的事情。真的是工欲善其事必先利其器,好工具能夠大大提高工做效率。xml
前先後後由於爬蟲去學了Maven,而後再Maven折騰了至少兩天時間,而後又回頭研究爬蟲,真正在爬蟲上花的時候並很少,基本對着手冊一頓操做操做就能夠了。此次也算收貨不小,像是以前折騰git同樣,不會的時候以爲沒有你難道就不行了,會了以後哈哈哈,這不就是典型的真香定律嘛,哈哈哈哈。如今沉迷GitHub,估計又要沉迷會Maven了,大神造的輪子都在上面隨便用呢。
學習這事不能放棄,死磕到底就好了(各位看官放下手中的磚頭,具體狀況具體來就好~)。