學術研究的一些心得體會網絡
當咱們開始高校研究生活時,咱們就踏上了學術研究之路。這是一條探索未知世界,追求知識真理之路。這條道路上佈滿荊棘,充滿了冒險和樂趣。本文經過分享本身在博士學習階段親身經歷的研究經驗和體會(主要涉及到文獻檢索、文獻閱讀、實驗設計和論文寫做這四個方面),但願能幫助一些入門研究不久的同窗對學術研究有新的認識,能在研究道路上少走彎路,邁向本身的成功之路。app
1 引言框架
2014年9月,我提着行李箱一我的來到大連這陌生的城市開啓了在大工的博士研究生涯。我是從大四畢業設計就已經開始接觸本身如今的研究領域——天然語言處理(Natural Language Processing, NLP),通過了碩士,博士這將近九年的摸爬滾打,本身也有了一些研究的心得體會。特別是博士這五年,我以爲是我在研究道路上成長的五年,是自我感悟和磨練的五年。在博士的最後階段,藉此機會,寫下我這些年在學術研究之路上本身的一些學習研究經驗,但願能對你們有所幫助。ide
在介紹本身的研究經驗以前,我推薦一本凌曉峯和楊強老師著的《學術研究,你的成功之道》[1],這也是當年博士入學時導師推薦給個人。這本書對我學術研究起到了很大的幫助,我也是參考借鑑了書中的研究經驗和體會,踏上了本身的研究之路。工具
圖1. 學術研究的主要環節學習
什麼是研究?在天然科學和工程領域,研究廣義上能夠理解爲,經過可重複性的觀察和可驗證的結果,可以對人類認知世界作出首創性且具備影響力的貢獻[1]。創新是研究的核心,影響力是研究的成績單。興趣是研究的最好動力,在研究的過程當中每每會遇到各類想不到的坎,會讓人受挫甚至想放棄,當你對本身的研究領域充滿興趣時,你天然而然就會有很強的主動性,而不是以爲研究是一個枯燥無味的任務。在學術研究中,咱們通常會作些什麼?其實,學術研究經常是一項系統工程,主要會包括下面幾個環節(如圖1所示),來共同完成對創新的追求。首先是肯定一個方向,提出問題,而後提出本身的解決方法,經過設計實驗來進行驗證方法的有效性,最後撰寫發表論文。這五個環節並非按照線性順序一次進行和完成,而是一個多層迭代和循環的過程。而在這整個研究過程當中會涉及到不少內容,我將主要談一下在文獻檢索、文獻閱讀、實驗設計和論文寫做這四個方面上本身的經驗體會。測試
2 文獻檢索字體
目前正式發表的論文,主要有兩種來源。一種是期刊論文,期刊論文通常是不限定截稿時間,任什麼時候間均可以由做者向期刊投稿,而後通過多個同行專家評審,並通過可能屢次修改獲得專家承認後,才能由期刊正式出版發表。因此通常期刊上的論文寫做會更爲規範,在實驗設計方面更加的系統完整。可是因爲整個過程週期較長,通常一篇論文從投稿到最後發表都須要半年甚至一年以上時間,因此技術會有必定滯後性。另外一種是會議論文,特別是做爲咱們計算機專業,技術發展更新快,會議論文十分重要。相比期刊論文,會議論文通常一年舉辦一次會議,並在相對固定的時間內徵稿,有投稿截止日期。因此在論文寫做上,因爲時間緊迫,可能沒有那麼規範。會議論文更強調創新性,發表的週期短,可以更快的獲取的技術發展的前沿研究。近年來,因爲研究技術更新快,預印本文庫(arXiv, https://arxiv.org/)能夠發佈本身的最新成果,也已經成爲了解最新技術的重要信息源。但上面的論文並無通過嚴格的篩選,因此質量良莠不齊,最好選擇已經錄用,或者知名團隊的論文,須要本身進行判斷。ui
在海量文獻中,咱們最好是閱讀一些高質量的論文,若是做爲一個初學者,如何能知道哪些論文會具備高影響力呢?對此,我有如下幾條參考建議:搜索引擎
在進行學術研究之初,作好文獻檢索調研工做是十分重要的。文獻檢索是根據科研工做或科研課題的須要,有計劃、有組織、系統全面地調查、收集有關文獻資料的工做過程。當咱們肯定了研究方向和任務時,如何比較完整地把相關文獻檢索出來呢?我通常會經過查找綜述論文,查找表明性論文和查找引用該論文的論文三個步驟來完成。
首先是查找綜述論文,一篇優秀的綜述論文每每可以讓你對該研究領域有個全面的瞭解。例如,文獻[2]是一篇生物醫學文本挖掘的綜述論文,從論文提綱目錄(如圖2所示)咱們看到,綜述論文中通常會提供該領域的任務介紹、相關數據集和工具,並對現存方法進行系統分類,給出每類方法的表明性工做,最後描述目前應用、存在的挑戰和未來工做方向等。對於綜述文獻的檢索:咱們能夠利用谷歌學術搜索引擎經過關鍵詞+review/survey/tutorial組合來進行綜述檢索;或者查看一些綜述性期刊;還有就是利用中國知網(http://www.cnki.net/)和學術搜索引擎去查找相關的國內外博士論文,經過博士論文中的相關工做章節來了解目前研究情況。
圖2. 綜述文獻[2]目錄
除了檢索相關綜述論文之外,咱們還須要檢索最近的研究論文。利用學術搜索引擎檢索關鍵詞,而後根據時間排序來找到最近相關論文,或者在近年的頂級會議和頂級期刊中檢索相關內容。再從這些研究論文的相關工做(Related Work)中找到系列表明性工做。例如圖3所示,這是2017年NLP領域頂會ACL上一篇進行實體關係聯合抽取工做論文[3]中的相關工做部分。從這篇論文的相關工做裏,咱們能夠找到實體關係抽取的表明性方法。
圖3. 文獻[3]相關工做部分
最後就是查找引用該論文的論文,經過谷歌學術搜索引擎能夠從引用該論文的列表中找到一個研究工做的後續相關工做。例如利用谷歌學術搜索找到引用文獻[3]的論文列表,以下圖,能夠看到引用該論文的論文基本都是和實體關係聯合抽取相關的後續工做。
圖4. 引用文獻[3]的谷歌搜索結果
總結一下,在進行文獻檢索時,能夠先查詢綜述文獻,從綜述文獻中對研究任務有個總體瞭解;而後經過關鍵詞查詢近期論文,從其相關工做中向前看找到表明性工做;最後查找引用該論文的論文,向後看找到相關工做的後續工做。這樣通常就可以比較完整地檢索出相關論文。
3. 文獻閱讀
在學術研究時,須要進行大量的文獻閱讀。可是咱們也不能把全部時間都花費在閱讀論文上,這就須要咱們進行高效的文獻閱讀。其實咱們在進行文獻閱讀前,咱們須要明確閱讀目的,這樣閱讀時纔會有所偏重。通常文獻閱讀主要有下面的目的:1)瞭解研究現狀,掌握現有解決方法,存在的問題和挑戰。這樣咱們通常能夠去閱讀一些綜述論文。2)把握學術動態和前沿,建議閱讀近期的頂會頂刊論文。3)對於瞭解和掌握一些工程性的處理操做(好比預處理,超參設置,經常使用特徵等),建議閱讀一些評測論文。4)學習論文寫做,能夠閱讀一些頂級期刊中第一做者母語爲英語的研究者的論文。5)平日積累,豐富知識,能夠天天刷刷arXiv。
圖5. 論文通常框架結構圖
在閱讀論文時,咱們不要每篇論文都一字一句從頭讀到尾,這不只會浪費太多的時間和精力,還會使你的研究思路僵化。通常論文閱讀能夠分爲泛讀和精讀,在咱們明確了閱讀目的後,再根據需求進行選擇。首先是泛讀,咱們應快速瀏覽一遍論文。通常學術論文寫做是有必定框架結構的。圖5展現了一篇論文通常的框架結構,實線框的部分通常是論文高層次概念,閱讀這些內容能夠快速的瞭解論文,對其研究問題、主要動機、解決方案以及實驗室結果大體瞭解。若是咱們泛讀以後,根據本身的判斷和需求,須要進一步的深刻,那麼再進行精讀,不然這篇論文只需泛讀掌握核心內容便可。對於精讀,咱們須要從頭再讀一篇,細緻地推敲論文,能夠從網上搜索一些相關資源來幫助理解,若是這篇論文附有源碼也能夠經過閱讀源碼來加深對論文的理解。
在閱讀以後,咱們經常會忽略的是思考。閱讀後的思考其實比閱讀更重要,只有經過思考,咱們才能從中挖掘新想法,嘗試着如何更深刻研究去超越目前工做。當咱們閱讀以後,建議你們再對閱讀的論文作下面一些思考:1)總結性思考,總結和思考這篇論文的亮點在什麼地方,咱們能從中學習到什麼。2)批判性思考,帶着批判的眼光去思考,做者提出的假設條件是否成立?提出的問題是否合理?解決方法有沒有缺陷?3)創造性思考,若是不用做者的這套方法,對於這個問題,咱們是否還能想到更好、更新和其餘的解決方法?4)遷移性思考,做者提出的這種方法是否可以應用於其餘任務來解決其餘問題?當咱們養成思考的習慣後,經常會在思考的過程當中找到研究靈感。
俗話說:「好記性不如爛筆頭」。當咱們通過一段時間的積累後會發現,本身閱讀的論文會愈來愈多,有時又想回過頭去再看看那篇論文,但經常都不知道本身把論文丟在哪了。因此學會管理文獻和作好閱讀總結筆記也是很重要的。在閱讀論文時,能夠根據習慣打印出紙質版的論文或者直接在電腦上進行閱讀,閱讀以後建議你們學會利用一些軟件來管理本身的文獻。我本身使用的是Mendeley軟件(https://www.mendeley.com/),這是一款免費的文獻管理軟件。將論文拖進軟件中軟件會自動識別論文的基本信息,你還能夠利用它創建樹形目錄來對閱讀後的論文進行分類。此外還有高亮,註釋,筆記,雲同步等功能,十分方便。並且能夠經過軟件的檢索功能很快找到你想查詢的相關論文。每次閱讀完論文後,建議你們作一個簡單的總結筆記,這樣不只能夠鍛鍊你對論文核心內容的總結能力,並且對於過後再讀這篇論文時,經過總結筆記可以快速的觸發你的記憶點,回想起論文的內容。一個簡短的總結筆記應該包括論文簡介,論文亮點,實驗結果和思考等內容。圖6就是我對一篇論文[4]的總結示例。
圖6 Mendeley管理文獻展現
總的來講,明確閱讀目的後進行泛讀或者精讀,閱讀後養成思考的習慣,學會管理文獻和作好閱讀筆記,提高文獻閱讀的效率和質量。
4. 實驗設計
對於理工科,實驗設計是學術研究中不可缺乏的部分。實驗最重要目的就是驗證咱們提出方法的有效性。再進行實驗設計時,咱們須要時刻遵循三個關鍵詞:合理、可靠和完備。實驗設計合理,使用數據和數據來源可靠,實驗對比方案完備。通常實驗設計會涉及到下面幾個內容:實驗數據,輔助實驗,主實驗,與先進方法對比和結果錯誤分析。
實驗數據:再進行實驗以前,咱們得選擇合適的實驗數據。並且實驗數據的來源得可靠。通常咱們能夠選擇一些國內外公開評測的數據集或者是一些其餘已發表相關論文中經常使用的數據集。若是你研究的問題確實沒有現存的數據集,須要本身構建的話,必定要按照標準正規的方式進行數據集構建。對於同一個研究問題,最好能在多個相關數據集上進行實驗,來講明模型方法的泛化能力,這樣實驗結果也更具說服力。此外,咱們還須要注意測試集的規模,儘可能不要在測試集規模太小的數據集上進行實驗,這樣獲得的結果缺少說服力。
輔助實驗:一些模型構建時的細節實驗,目的是展現一些非核心的部件對模型的影響。例如,不一樣超參數(如詞向量維度,網絡深度等)對模型的影響,不一樣常規模塊對研究方法效果的貢獻,不一樣數據劃分對研究方法的影響等。
主實驗:驗證論文創新點的核心實驗,這些實驗須要根據論文創新工做特色而有針對性的設計,目的是證實本研究工做創新點的有效性。在實驗中儘可能控制其餘變量,只聚焦於本研究關注的挑戰問題便可。實驗設計要儘可能完備,從各個角度去考量提出創新部分的有效性。
與目前先進方法對比:目的是說明本研究工做到達的水平。在與先進方法對比時,不只須要提供同一個數據集上的先進方法結果對比,還須要重現不一樣數據集上的相關方法在本實驗數據集上的結果進行比較。
結果展現和錯誤分析:前面的實驗數據結果基本都是定量分析,在實驗設計裏咱們也須要進行定性分析。經過對模型輸出結果的實例進行錯誤分析,發現研究工做中的優缺點。錯誤分析十分重要,有時只經過定量的結果數值咱們沒法從中發現問題,而經過對錯誤結果的定性分析思考,咱們更容易發現模型的問題所在,從而提出新的方法去進行改進。
5. 論文寫做
當咱們已經按照上述流程順利完成了實驗,並獲得了不錯的研究結果。那麼接下來的任務就是撰寫和發表學術論文,給讀者呈現本身的研究成果。學術論文與其餘寫做形式有所不一樣,學術論文最重要的是內容必須真實、可信和準確。因此在寫做時應該保持嚴謹,認真的態度,使用正式的書面語,實事求是地去闡述你的研究工做和結果。目前工程領域的學術論文已經造成比較固定的結構,絕大部分論文都會包含下面幾個部分:題目、摘要、引言、相關工做、方法、實驗和總結。
上面是一篇學術論文寫做應該包含的主要內容,寫做不須要過於花哨的辭藻,重要的在於向讀者清晰準確地描述本身的研究工做。此外,在對於論文寫做還應該注意下面幾點:
實際上,如今也有不少很好的如何進行論文寫做的學習資料,在此我推薦清華大學劉洋老師的一個PPT《機器翻譯學術論⽂寫做⽅法和技巧》[5]和清華劉知遠老師的一篇博文《如何寫一篇合格的NLP論文》[6],我相信經過仔細閱讀這些資料會對你的論文寫做有所幫助。
6 總結
學術研究之路是探索之路,是追求之路,是磨練之路。本文是我在本身目前的研究之路上的一些心得體會和經驗分享。分別從學術研究中的文獻檢索、文獻閱讀、實驗設計和論文寫做幾個環節上進行分享。也是但願能夠對一些入門研究不久的同窗起到一些幫助做用,早日走上本身的學術之路。
參考文獻:
[1] 凌曉峯,楊強.學術研究,你的成功之道[M].清華大學出版社,2012年.
[2] Zhu F, Patumcharoenpol P, Zhang C, et al. Biomedical text mining and its applications in cancer research[J]. Journal of biomedical informatics, 2013, 46(2): 200-211.
[3] Zheng S, Wang F, Bao H, et al. Joint extraction of entities and relations based on a novel tagging scheme[C]. Proceedings of the 55th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers). 2017: 1227-1236.
[4] Liu B, Zhang T, Han F X, et al. Matching natural language sentences with hierarchical sentence factorization[C]. Proceedings of the 2018 World Wide Web Conference on World Wide Web. International World Wide Web Conferences Steering Committee, 2018: 1237-1246.
[5] 劉洋. 機器翻譯學術論⽂寫做⽅法和技巧. 2014年. http://nlp.csai.tsinghua.edu.cn/~ly/ talks/cwmt14_tut.pdf
[6] 劉知遠. 如何寫一篇合格的NLP論文. 2019年. https://zhuanlan.zhihu.com/p/58752815