經過語音檢測新冠?新方式還有待驗證

新冠肺炎疫情在海外迎來了爆發之勢,而檢測手段的繁瑣和設備的短缺,也成了疫情防控過程當中的攔路虎。html

許多媒體都報道,檢測不力是多國沒法有效追蹤疫情,致使病例迅速激增的一個緣由。算法

近日兩所知名的高校,卡內基梅隆大學(CMU)和劍橋大學,不約而同地使用了一種新的方式:經過 AI 系統分析聲音信息,來檢測被 COVID-19 感染的風險。
截屏2020-04-02 上午10.48.07.png安全

CMU:幾分鐘就可給出結果

在卡內基梅隆大學給出的測試器 COVID Voice Detector 中,須要完成幾種聲音的錄製,僅需幾分鐘便可獲得感染風險的結果。機器學習

進入網站註冊後,須要進入我的狀況的填寫。其中涉及的信息包括人種,年齡,健康情況,是否確診或確診過等信息。學習

b8280c86652752577b4e6b1fe53cfd99.jpg

  • 須要填入身體健康情況的信息

上述信息填寫完畢後,須要錄製咳嗽、英文元音的發音,數字和字母表朗讀等語音信息。測試

而模型通過了確診者和正常測試者的一些數據的訓練,能夠對新輸入的聲音進行分類的匹配。網站

最終會返回一個分數,代表所錄製的聲音,和收集到的 COVID-19 患者數據相比,感染特徵相符合的程度。spa

截屏2020-04-02 上午10.49.36.png

  • 最終呈現出來的結果

爲了讓系統的判斷儘量準確,必須擁有足夠多的訓練數據,並且還要涵蓋多元化的信息,研究人員正在倡議更多的志願者參與進來。3d

此外,他們稱系統具有可擴展性,如聲音來自其餘呼吸系統疾病的人,算法就可學到該類疾病的聲音特徵。htm

0003KQXQA9IRA768-C324-F4.jpg

  • 新聞報道中的音源也被採用

測試器地址:
https://cvd.lti.cmu.edu/cvd/

發稿前訪問該網站,提示由於在更新和維護的緣由暫時關閉,相關負責人表示,有望在本週末再次上線。

劍橋大學:還僅僅是收集數據

和卡內基梅隆大學相似,劍橋大學也推出了用聲音檢測 COVID-19 的項目。但稍有不一樣的是,劍橋大學僅僅仍是隻是收集數據,還不提供檢測的結果。

截屏2020-04-09 下午6.15.38.png

  • 項目網頁的提示:貢獻聲音,助力科學,保證安全

系統收集數據的方式相差不大,須要填寫基本資料和醫療信息,並經過手機麥克風採集語音信息做爲訓練樣本。

一樣地,系統也會調查用戶的身體健康狀況,好比是否發燒、是否感染過等信息。需錄製的項目有呼氣聲、咳嗽聲和閱讀文本的聲音。

截屏2020-04-09 下午6.30.50.png

  • 須要錄製的聲音內容

項目負責人 Cecilia Mascolo 教授解釋說,因爲該項研究的大型數據集很是少,爲了提供更好的算法以用於早期檢測,須要收集到足夠多的數據量。

他還表示到,數據量累計以後,即使沒有足夠冠狀病毒陽性病例,還能夠找到與其餘呼吸道疾病有關的信息。

該項目的最終目標是,開發出可自動檢測疾病的機器學習算法,以可推廣使用的檢測 App 來呈現。

項目地址:
https://www.covid-19-sounds.o...

語音取證,可以精準識別嗎?

兩個項目彼此獨立,但使用的方式和原理擁有着一些共性。而對於項目的具體原理,雙方卻都沒有給出太多信息。

卡內基梅隆大學的研究團隊,曾長期致力於語音取證技術。他們認爲人的聲音,受到器官機構情況和健康程度的影響,能揭示生理,心理甚至醫學數據。

受肺炎病毒感染的患者,肺部會發生一些病變,其呼吸模式等參數會受到影響,致使發出的聲音出現一些異常特徵,對算法而言是一個可以抓取的特色。

farge-004.jpg

  • 醫生正在檢查肺部 CT

劍橋大學的團隊,也是由多位專家、博士組成。在項目介紹中他們表示到,新冠肺炎做爲一種呼吸系統疾病,感染疾病的人發出的聲音會存在一些特徵,包括聲音,呼吸間隔和咳嗽聲等。

雖然這種方式很新穎,但兩個項目都處於初期階段,在 BBC 的一篇報道中,還使用了「Teething problems」(出牙痛,指代初期困難)來代表此方案的困難。

不過在以前的研究中,用聲音來診斷疾病的案例中,出現了一些成功的案例。

好比,成立於 2014 年的 ResApp Health,就專一使用機器學習算法來分析咳嗽聲,來診斷和測量各類慢性和急性疾病的嚴重程度。目前取得了一些成果,可對哮喘,肺炎和毛細支氣管炎等疾病進行判斷。

ResApp.png

  • 目前應用已經成熟並投入了使用

另外一個叫 Sonde 的公司,在去年還得到了一項語音診斷的美國專利。他們開發的一個平臺,經過感測和分析語音中的細微變化,可從講話中判斷患者的健康情況,輔助醫生進行診斷抑鬱症、癡呆症等病症。

用聲音診斷 COVID-19 的項目,相比已經成熟的研究,除了時間緊迫以外,關於疾病的聲音數據也少之又少,因此難度和挑戰也不小。

存在爭議,是否有效還待驗證

對於兩個項目來講,研究沒有通過 FDA 或 CDC 的批准,還不能用於正規的醫學診斷。

現階段的最大目的在於,呼籲更多人(包括確診者和正常人)貢獻本身的聲音數據,以推進該研究項目的進展,進而去幫助對新冠等流行病的控制。

GKkKVJoSiLgonX6eCRZGcB (1).jpeg

  • 手機使用檢測程序時的界面

關於這些研究,也出現了是否會有效的爭議。好比不一樣地區疫情的程度不一樣,會不會帶來模型的分析偏見。而簡單的語音錄製,雖然方便但收集的語音信息,是否達到了科學分析的要求。

如今看來,關於系統的專業性和準確度,還須要等待後續的驗證。在此以前,沒人知道前方的道路,但另外一方面,這正是科學探索的魅力所在。

相關文章
相關標籤/搜索