死磕論文前,不如先找齊一套好用的工具

選自 Medium,做者:Eddie Smolyansky,機器之心編譯,參與:劉曉坤、王淑婷。git

還在機器學習論文的海洋裏忘我沉淪?先花幾分鐘學些新工具,不虧,論文閱讀、評論、社交、管理、搜索、復現、寫做全不誤。github

做爲像深度學習這樣高產領域的研究人員,咱們常常會發現本身被論文的汪洋所淹沒。這些論文是如此之多,想所有讀完並跟蹤最新研究彷佛很難很難。我以爲造成這種局面的一個重要緣由是,咱們沒有充分利用現有工具和服務來讓工做變得更加簡單。另外一個緣由是缺乏可以在一個界面下知足咱們全部需求的真正好產品,不過說到這個就得另寫一篇博客了。web

最近,我開始瞭解 ML 的一個子領域,對該子領域相關文獻的優先排序、閱讀和管理讓我感到很是沮喪……最後我選擇找些工具來幫忙處理這項任務,我想把這些好用的產品和服務分享給大家。但願可以幫那些須要和科學論文打交道的人改善工做流程。算法

我主要關注的是論文閱讀和展現的問題(而非寫做):瀏覽器

  1. Reference Manager(也叫論文庫)機器學習

  2. 用社交平臺來分享知識編輯器

  3. 運用自動論文分析算法來獲取額外的元數據(關鍵詞、相關數據集、重要引用等)工具

Reference Manager(也叫論文庫)學習

你能夠在這些平臺上建立和管理全部之前和將來的閱讀清單,添加我的筆記並和小組分享。這些庫會被同步到雲端,也就是說你在任何地方都能打開論文。看書能夠用 goodreads,不過看論文的話,最好從下列工具中選擇:網站

  1. Mendeley:這款產品雖然顏值不咋地,但它有免費的商業模式,支持 web、PC、Mac 和移動手機等多個平臺。除了通常的論文筆記,你還能夠直接註釋和高亮顯示 PDF。它的雲存儲是有限額的,超過幾百篇論文以後就得付費。

  2. Paperpile:它須要付費訂閱(沒有免費版本,能夠用谷歌帳號免費試用 30 天),但看起來很潮,用起來也感受不錯。你能夠很是輕鬆地把論文庫從其它服務平臺上導入到這款產品中。你還能夠把庫同步到本身的谷歌雲,這算是它的一個優點。目前它只能在谷歌瀏覽器上使用。

  3. Zotero:這是一個免費和開源的實現,你只需爲超額的雲存儲付費。相似 Mendeley,不過功能沒它多。

  • Mendeley:https://www.mendeley.com/

  • Paperpile:https://paperpile.com/

  • Zotero:https://www.zotero.org/

固然,你還有不少選擇,不過這幾個是我用過而且感受還不錯的。若是讓我選的話我會選 Mendeley,由於它支持不少平臺並且還免費。

Mendeley 的界面

Zotero 的界面

arXiv 進化版

arXiv 於 1991 發佈,並在近十年內鮮有變化,儘管論文發表數大幅增加(到 2016 年 10 月提交論文數已經達到了每個月超過 10000 篇)。固然,咱們如今對論文資源庫提供的功能已經有不少新的需求。咱們想要能執行論文分析的算法,想找到實現論文結果的代碼,但願有能共享信息的社交平臺,咱們還可能對雙列格式的 pdf 文檔感到厭煩。

在網上搜索現有解決辦法以後,我找到不少此類工具。


社交平臺

  1. Shortscience:這是一個能共享論文概述的平臺,目前有超過 1000 篇論文概述,並仍在持續增加;

  2. OpenReview:這是一個能提供公開論文評審過程的平臺,全部提交的論文會公開做者姓名等信息,同時接受同行的評價及提問,能夠匿名或實名地對論文進行評價。公開評審結束後,論文做者也可以調整和修改論文。Openreview 目前僅對特定學術會議提供評審功能,例如 ICLR,而且因爲受到普遍質疑,ICLR 在 Openreview 上的評審也被改爲了雙盲評審。除了官方評審以外,近期不少論文的評論區也能看到讀者和做者之間的積極交流。

  3. Scirate:能看到熱度較高的 arXiv 論文,並按學科分門別類,還能瀏覽相關論文的評論。但其熱度排序基於該網站內的點贊數,而這個網站的活躍度並不高。

  • Shortscience:http://www.shortscience.org/

  • OpenReview:https://openreview.net/

  • Scirate:https://scirate.com/


Shortscience 的論文概述示例

Openreview 上的 ICLR 2019 論文及評審示例

找到論文的代碼實現

  1. Papers With Code:自動把論文鏈接到實現代碼的 GitHub 資源庫和數據集,並根據 GitHub 的收藏量排序。每篇論文可能有多個合併的條目。

  2. Github pwc:以至關簡潔的列表關聯論文和代碼實現,包含最新的 NIPS 論文。

  3. GitXiv:每一個項目能夠方便地展現爲 arXiv+GitHub+連接+討論,惋惜的是這個項目再也不維護了。

  • Papers With Code:https://paperswithcode.com/

  • Github pwc:https://github.com/zziz/pwc

  • GitXiv:http://www.gitxiv.com/

Papers With Code 界面。

GitHub pwc 頁面上的一些連接。

其它工具

  1. arXiv-sanity:相比於 arXiv 有很大的改進,包括在瀏覽中顯示摘要、評論和很是基本的社交、庫功能。這個整合了不少便捷功能的網站,是 Andrej Karpathy 在空閒時開發的。

  2. arXiv-vanity:能夠未來自 arXiv 的論文渲染成響應式網頁,從而讓人們不用再看 pdf 文檔。

  • arXiv-sanity:http://arxiv-sanity.com/

  • arXiv-vanity:http://arxiv-vanity/

arXiv-sanity 界面

arXiv-vanity 轉換論文示例

論文搜索和分析

  1. Google scholar:現在搜索論文的首選,能夠在這裏查看論文統計和引用參考文獻,還能經過關注做者或者論文得到新論文更新提醒,以及利用自動化推薦來提供一個基本庫。

  2. Semantic scholar:能夠結合外部材料整合進行論文的語義分析。功能包括:展現引用和參考文獻、度量論文影響力、展現論文圖表、自動生成關鍵詞(根據標題)、分析做者、在互聯網尋找額外資源(例如,相關 youtube 視頻),以及推薦論文。

  • Google scholar:https://scholar.google.co.il/

  • Semantic scholar:https://www.semanticscholar.org/

  • Semantic Scholar: author profile page


Semantic Scholar:做者簡介界面

適用於做者的工具

  1. Overleaf:支持多人協做的在線 LaTeX 編輯器,比如用谷歌文檔寫論文,很好實現。

  2. Authorea:一種支持多人協做在線撰寫論文的方法,旨在減小 LaTeX 的使用,支持現代 WYSIWYG 編輯器。支持內聯代碼和數據,促進可復現性,支持內聯公共評論和其它合理功能。

  3. Code ocean:基於雲計算的再現性平臺。個人理解是你將本身的研究做爲 Jupyter 環境代碼上傳,而後在線運行,並復現做者曾取得的相同圖表/輸出。

  • Overleaf:https://www.overleaf.com/

  • Authorea:https://www.authorea.com/

  • Code ocean:https://codeocean.com/

[若是你以爲前文太長,能夠選擇……不看]

個人建議

  • 管理閱讀庫:Mendeley

  • 閱讀和寫論文評論:shortscience 和 openreview

  • 將論文和 GitHub 資源庫匹配:paperswithcode 和 pwc

  • 論文和做者分析:Semantic scholar

  • 寫論文:Overleaf

順便提一下,谷歌最近發佈的 Dataset Search 也是搜索數據集的神器哦。

最後,但願這篇博客裏推薦的服務平臺中至少有一個能讓你改善工做流程。嘻嘻~


arXiv 上不一樣主題的提交量,數據來自其統計頁面。

原文地址:towardsdatascience.com/finding-and…

相關文章
相關標籤/搜索