肺癌致死率高,且大部分發現即晚期。早期的低劑量CT篩查能夠有效提升存活率,可是僅有少數病患接受了篩查,且低劑量CT篩查仍然存在問題,如較高的假陽性結果。今日,谷歌發佈新研究,展現了AI能夠診斷肺癌,可以幫助提高全世界不少病患的存活率,有助於早期肺癌CT篩查在全世界範圍內的推廣。算法
根據世界衛生組織,肺癌每一年形成 1700 萬人死亡,是致死率最高的癌症(死亡率超過乳腺癌、前列腺癌和結直腸癌的總和),是全球第六大死因。儘管肺癌在全部癌症中存活率最低,但若是發現得早並及早干預是能夠有更多治療機會的。然而,統計數據顯示,大部分肺癌到了晚期才被診斷出來。app
過去三十年,醫生探索了不少方式來診斷肺癌高危人羣。儘管低劑量 CT 篩查被證實可以下降肺癌死亡率,可是仍然存在一些問題致使不明確的診斷結果、後續沒必要要治療、醫療成本等等。框架
谷歌的最新研究性能
根據谷歌博客介紹,谷歌於 2017 年底開始探索如何使用 AI 解決一些挑戰。研究者利用 3D 體建模的進展,結合來自谷歌合做夥伴(包括美國西北大學)的數據集,在建模肺癌預測方面取得了很大進步,爲將來臨牀測試奠基了基礎。谷歌的相關研究已發佈在 Nature Medicine 上。學習
該研究所用數據集:測試
LUNA: https://luna16.grand-challenge.org/data/優化
LIDC: https://wiki.cancerimagingarchive.net/display/Public/LIDC-IDRIui
NLST: https://biometry.nci.nih.gov/cdas/learn/nlst/images/google
該研究中來自美國西北大學的數據集暫未公開。人工智能
放射科醫生在一次 CT 掃描中一般須要查看數百張 2D 圖像,而癌症是很微小也很難看到的。谷歌研究者建立了一個模型,該模型不只可以生成肺癌惡性腫瘤總體預測,還能夠識別出肺部不易被察覺的惡性組織(肺結節)。該模型還能夠將以前的掃描結果考慮在內,幫助預測肺癌風險,由於肺結節的增加速度有可能預示着有惡性腫瘤的存在。
在谷歌的這項研究中,研究者利用 45856 個去識別化的胸部 CT 掃描案例(其中一部分是癌症病例),這些案例來自美國國家肺癌篩查試驗(National Lung Screening Trial, NLST)和美國西北大學的 NIH 研究數據集。研究者使用另外一個數據集進行驗證,並將實驗結果與六名美國認證放射科醫生的診斷結果進行對比。
在使用單次 CT 掃描進行診斷時,谷歌的模型性能堪比甚至優於六名放射科醫生。與沒有輔助的放射科醫生相比,該模型檢測出的癌症病例多出 5%,且假陽性檢查結果減小了 11% 以上。谷歌的方法得到了 94.4% 的 AUC(曲線下面積)。
下圖展現了在僅使用當前 CT 掃描時,該模型與人類放射科醫生的肺癌檢測性能對比:
下圖展現了,在使用當前和以前 CT 掃描時,該模型與人類放射科醫生的肺癌檢測性能對比:
下一步計劃
儘管肺癌篩查具備很大價值,但如今美國僅有 2-4% 的相關病患接受篩查。谷歌的這項研究展現了人工智能在提高肺癌篩查準確率和一致性方面的潛力,這將有助於加速在全球範圍內推廣肺癌篩查。
這些初步結果使人鼓舞,但後續研究將對臨牀實踐中的影響和效果進行評估。研究者正與 Google Cloud Healthcare 和 Life Sciencecs 團隊合做,並經過 Cloud Healthcare API 提供該模型,同時與全球合做夥伴進行早期接洽以繼續其餘的臨牀驗證研究和部署。
論文:End-to-end lung cancer screening with three-dimensional deep learning on low-dose chest computed tomography
論文地址:www.nature.com/articles/s4…
2018 年,美國肺癌死亡人數約爲 160000,是美國排名第一位的腫瘤死因。使用低劑量 CT 篩查進行肺癌掃描已被證明可以將死亡率下降 20–43%,低劑量 CT 篩查現已包含在美國篩查指南中。但仍然存在一些挑戰,包括評估者差別可變性(inter-grader variability)以及較高的假陽性和假陰性率。
谷歌研究者提出了一種深度學習算法,利用病患當前和之前的 CT 來預測肺癌風險。他們提出的模型在 6716 個美國國家肺癌篩查試驗病例上取得了當前最佳的效果(曲線下面積爲 94.4%),並在包含 1139 個病例的獨立臨牀驗證集上得到了相似的性能。
研究者還進行了兩項評估者研究。當之前的 CT 影像不可用時,模型效果優於全部六位放射科醫生的診斷,將假陽性率下降 11%,假陰性率下降 5%。當之前的 CT 影像可用時,模型效果與放射科醫生的診斷至關。這爲利用計算機輔助和自動化來優化篩查過程提供了機會。目前絕大多數病患處於未接受篩查的狀態,研究者認爲深度學習模型有助於提高全球範圍內肺癌的篩查準確率、一致性和推廣。