做者|Adrian Raudaschl
編譯|VK
來源|Towards Data Sciencegit
儘管目前正在蔓延的冠狀病毒疫情已經很可怕,但觀察世界各地的學術界和研究界是多麼迅速地開始瞭解這種病毒及其潛在影響,仍是頗有意思的。github
正由於如此,不少有趣的學術論文都很快就出來了。我鼓勵你仔細閱讀預印本,由於所做的聲明是未經覈實的,但我想看看這些文件所討論的主題和結論中是否有任何明顯的模式。api
所以,我從Elsevier新型冠狀病毒信息中心的列表中,手工抓取了這些預打印論文的結果和看法部分,並使用流行的Gensim庫使用LDA進行了一些主題建模。若是你想親自嘗試的話,我在這篇文章的底部提供了GitHub連接。機器學習
在75份預印本上訓練多個LDA模型後,32個主題看起來是最佳的(也許20個主題也能夠),一致性值爲0.54。而後,我選擇了最突出的主題關鍵字集合,推斷出中心觀點,併爲每個找到了最具表明性的文章。ide
這篇文章毫不是一篇科學評論,而是一個我想分享的小實驗。也許咱們可使用這樣的工具更快地從多個來源識別模式。工具
關鍵詞:肺炎,確診,證據,死亡,北京,聚焦,大,預測,努力,傳播oop
儘管該病毒已證實具備高度傳染性,可在兩肺天然感染,但臨牀證據代表,武漢病毒性肺炎病死率較低。CT對武漢市病毒性肺炎的篩查、診斷、隔離方案、治療、處理及預後有重要意義。學習
最具表明性的論文:Clinical and Imaging Evidence of Wuhan-Viral Pneumonia: A Large-Scale Prospective Cohort Study人工智能
該主題的文檔百分比:8%.net
關鍵詞:臨牀、診斷、顯著、高度、特徵、症狀、目的、指標、嗜酸性粒細胞、入院
利用人工智能技術篩選患者的白細胞、嗜酸性粒細胞計數、嗜酸性粒細胞率、2019年新型冠狀病毒RNA(2019n-CoV)和澱粉樣蛋白A等屬性,該團隊開發了一種更快的方法,以實現COVID-19的診斷,提升了臨牀確診率。
最具表明性的論文:Artificial Intelligence Application in COVID-19 Diagnosis and Prediction
該主題的文檔百分比:7%
關鍵詞:預防、健康、能力、有效、緊急、管理、增強、支持、準備、存在
各國在預防、發現和控制疫情方面的能力差別很大,這是由全球衛生系統管理衛生緊急狀況的能力差別所支撐的。咱們須要增強全球準備,遏制現有疫情,包括2019年nCoV的國際上的持續傳播。
最具表明性的論文:Review of Health Security Capacities in Light of 2019-nCoV Outbreak — Opportunities for Strengthening IHR (2005) Implementation
該主題文檔百分比:7%
關鍵詞:心理、因素、發現、疾病、社交、孤立、員工、識別、抑鬱
一項研究發現,超過三分之一的醫務人員在COVID-19爆發期間出現失眠症狀。相關因素包括文化程度、隔離環境、對COVID-19爆發的社會心理擔心、醫生職業等。針對不一樣的社會心理因素,對醫務人員進行失眠的干預。
最具表明性論文:Survey of Insomnia and Related Social Psychological Factors Among Medical Staffs Involved with the 2019 Novel Coronavirus Disease Outbreak
該主題的文檔百分比:7%
關鍵詞:措施、預防、城市、堅強、嚴格、個體、期待、維護、揭露、制止
在冠狀病毒疫情結束以前,咱們一直鼓勵採起強有力的預防措施。國內外其餘地方已證明,應效仿中國,當即採起有力干預措施。早期強有力的預防措施能夠有效阻止全球其餘城市獨立、自我維持的疫情爆發。
最具表明性的論文:Simulating the Infected Population and Spread Trend of 2019-nCov Under Different Policy by EIR Model
該主題的文檔百分比:7%
關鍵詞:檢測、pcr、樣品、rt、lamp、診斷、反向、核酸、拭子、篩選
定量反轉錄聚合酶鏈反應(qRT-PCR)是目前COVID-19檢測的標準;然而,反轉錄環介導的等溫擴增(RT-LAMP)能夠在風險點進行更快、更實惠的進行現場檢測。本研究的目的是開發一種快速篩查診斷試驗,可在30分鐘內完成。
最具表明性的論文:Rapid Detection of Novel Coronavirus (COVID19) by Reverse Transcription-Loop-Mediated Isothermal Amplification
該主題的文檔百分比:5%
關鍵詞:低,病人,酸,發熱,肺,混濁,地面,過程,特徵,圖像
在發熱門診中,COVID-19和核酸陰性患者之間的區別臨牀特徵不爲人知。2019年nCoV感染的核酸檢測率最高的是肌肉疼痛患者,其次是呼吸困難患者。發熱、嗜酸性粒細胞計數下降和雙肺磨玻璃樣混濁的影像學特徵多是2019年nCoV感染的一個有價值的指標。
最具表明性論文:Analysis of 2019-nCoV Infection and Clinical Manifestations of Outpatients: An Epidemiological Study from the Fever Clinic in Wuhan, China
該主題的文檔百分比:5%
關鍵詞:患者、症狀、系統、政府、人羣、年齡、人羣、顯著改善、腎臟
調查證明,該人羣的傳染性沒有明顯的年齡限制,但老年人仍然是脆弱羣體。糖尿病患者更易發展爲重症患者,進入ICU的機率明顯增長。
最具表明性的論文:Epidemiological and Clinical Features of 197 Patients Infected with 2019 Novel Coronavirus in Chongqing, China: A Single Center Descriptive Study
該主題的文檔百分比:4%
關鍵詞:嚴重,呼吸,治療,急性,方法,綜合徵,類似,水平,起源,發生
COVID-19感染引發嚴重呼吸系統疾病,相似於嚴重急性呼吸綜合徵冠狀病毒,與ICU的進入和高死亡率有關。咱們從病因、流行病學、治療方法等方面進行了研究,根據武漢協和醫院制定的治療方案,經衛生部批准,但願能開發出有效的治療方法,下降該病的死亡率。
最具表明性的論文:Clinical Characteristics and Treatment of Patients Infected with COVID-19 in Shishou, China
該主題的文檔百分比:4%
這是在論文領域應用NLP技能的一次嘗試。這個方法應該會出現問題,但這個想法頗有趣。
GitHub地址:https://github.com/Raudaschl/coronvavirus_preprint_research_nlp
歡迎關注磐創AI博客站:
http://panchuang.net/
sklearn機器學習中文官方文檔:
http://sklearn123.com/
歡迎關注磐創博客資源彙總站:
http://docs.panchuang.net/