憑藉着對算法和AI的嚮往,終於有機會接觸到人工智能的領域。如今的主要工做就是在OCR文字識別,期間也看了很多的論文,從CTPN到Faster RCNN,再到EAST和FOTS。最開始由於剛接觸這個領域,不少名詞看不懂,論文閱讀很是吃力,後來隨着知識的積累和深刻,如今閱讀也變得輕鬆起來。最近關注愛可可老師的微博,恰好發現了這篇文章——《How to Read a Paper》,感受很是適合我這種英語很差、可是又須要閱讀論文的人。git
本文就結合最近幾個月閱讀論文采的坑與《How to Read a Paper》結合,摸索一下大佬們的閱讀方法。github
通常的機器學習工程師或者深度學習工程師,都要閱讀大量的論文積累相關的領域知識。可是閱讀論文自己卻不多有人能傳授一些經驗,這篇文章提出了一種「三步法(three-pass method)」的方法,下面就來介紹一下。算法
一般會有不少緣由須要閱讀論文,好比回顧某個會議或者課程、對某個領域持續的關注、開拓新的領域等等。一個專業的學術研究員或者AI研究員可能須要花費幾百個小時來閱讀論文,所以高效的閱讀論文,是一種必不可少的經驗和技能。對於剛開始閱讀論文的人來講,須要通過不斷的嘗試和犯錯,才能總結出經驗和教訓。做者憑藉多年的閱讀經驗,總結出了閱讀論文的「三步法」,下面就來看看究竟是如何操做的吧。機器學習
閱讀論文最笨拙的方法就是從頭讀到尾,有的時候浪費了大量的時間還不知道做者到底說了什麼。若是採用三步法,通常是這麼個流程:學習
經過快速的瀏覽論文,對論文有一個總體的瞭解,而後決定是否有必要繼續深刻閱讀。這個階段大概花費5-10分鐘,主要會作下面的事情:搜索引擎
經過這個階段,檢查一下本身可否回答下面幾個問題:人工智能
經過上面的信息,你就能夠決定是否要繼續深刻下去了。若是這篇文章你壓根不感興趣,或者你暫時還不能理解它,又或者認爲做者的結論是錯誤的,那就不必繼續閱讀了。也能夠把它暫時放在一邊,過一段時間再來考慮要不要繼續閱讀。blog
另外,若是你也許要寫論文,那麼經過這個部分你應該也能瞭解到哪一部分是最重要的。首先必定要保證標題和副標題的連貫性、摘要的清晰程度,否則閱讀者頗有可能閱讀完摘要、掃過標題後,就放棄閱讀了。索引
在第二步中,須要閱讀的更仔細點,可是能夠把論證的部分給去掉。在閱讀的時候能夠劃重點、抓關鍵詞進行標記,也能夠把閱讀時不理解的地方記下來。這樣再次閱讀的時候就能夠多注意和思考這些問題,本身寫論文的時候也會更注意到相似的點。three
第二個階段大概須要花費一個小時的時間來仔細閱讀,經過這個步驟就能夠抓住論文的核心內容了。你能夠嘗試總結一下論文的主要內容、支撐的論點等等。
有時通過這個階段仍是對論文不理解,這有多是由於剛剛接觸這個領域,對於不少的概念和新名詞都不瞭解,或者做者使用的一些論點論據難以理解,也多是做者對於一些關鍵點沒有描述清楚。那麼你能夠選擇:
爲了更好的瞭解論文中的內容,最關鍵的就是第三步了,這一步須要讀者嘗試復現論文。假設你如今有了跟做者同樣的思路,那麼如何來複現它?經過復現的過程,就能輕鬆的理解文章的核心點,而且發現一些隱藏的坑和結論。
這一步就須要更加關注論文的細節了,須要理解和挑戰論文中的每個結論,甚至你能夠本身想一想有沒有其餘的思路。經過這種方式,就能夠把一些虛擬的經驗變成本身的真實經驗了。對於如今這個開放的互聯網時代,最簡單的辦法就是去github裏面搜搜有沒有現成的代碼,直接閱讀別人公開的源碼。
這個步驟可能會花費幾個小時、幾天甚至幾個月。通過這個階段,你能夠輕鬆的在腦海中重現整個論文的思路和結構,你也能抓住論文隱藏的結論,論文以外的工做,實驗過程當中潛在的問題以及分析的方法。
閱讀論文總的來講仍是一個經驗活,最起碼須要有幾十篇的閱讀量,才能進入一個陌生的領域。經過這個「三步法」,你能夠快速的判斷這篇論文是否值得深刻閱讀,是不是你感興趣的話題。
對於如何擴展知識、怎麼篩選論文,能夠經過下面的方法。
但願讀者都能在本身感興趣的領域快速積累起來,將來也會持續的關注愛可可老師的微博,真的頗有用!