看清頭禿元兇,騰訊AI首度揭示真相

出品 | AI科技大本營(ID:rgznai100)php

11月17日,騰訊公佈了一項人工智能助力藥物發現的新進展。程序員

經過騰訊自研的提高蛋白質結構預測精度的新方法,聯合研究團隊首次解析了II型5a還原酶(SRD5A2)的三維結構,揭示了治療脫髮和前列腺增生的藥物分子「非那雄胺」對於該酶的抑制機制,這將有助於深化研究相關疾病的病理學機制及藥物優化。算法

這次,騰訊 AI Lab 採用「從頭摺疊」的蛋白質結構預測方法幫助解析了SRD5A2晶體結構,並經過自研AI工具「 tFold」有效提高了蛋白質結構預測精度,在科研突破中發揮了核心做用。除了在SRD5A2結構中的應用,這套方法還能夠拓展應用於蛋白質分子和病理學機制的相關研究中。數據庫

該項聯合研究成果於近日登上了國際頂級期刊 Nature 子刊《 Nature Communications》。論文題爲《人體類固醇II型5a還原酶與抗雄激素藥物非那雄胺的結構研究》,由南科大生物系魏志毅副教授課題組與匹茲堡大學張誠教授、新加坡 A*STAR 研究所範昊研究員、騰訊 AI Lab 黃俊洲博士帶領的研究小組合做完成。服務器

論文連接:https://www.nature.com/articles/s41467-020-19249-z網絡

據瞭解,tFold工具還在CAMEO(全球惟一的蛋白質結構預測自動評估平臺)的國際測評中連續半年保持周度冠軍。目前,tFold公測版本已經過騰訊「雲深智藥(iDrug)」平臺官網對外開放。機器學習

連接:ide

https://drug.ai.tencent.com/console/cn/tfold工具

「從頭摺疊」新方法破解晶體學難題學習

在人體內,性激素有促進性器官成熟、副性徵發育及維持性功能等做用。

二氫睾酮是人體中已知最強的雄激素,對於人體的發育和生理活動相當重要,但同時也須要保持合理的平衡。一方面,二氫睾酮控制着男性性器官的發育,水平太低將致使男性性徵缺陷。另外一方面,水平太高又是致使前列腺增生和脫髮的罪魁禍首。

合成性激素依賴類固醇還原酶,二氫睾酮即由 SRD5A2 催化合成。所以,當患者由於二氫睾酮水平太高而出現前列腺增生和脫髮問題時,能夠經過抑制 SRD5A2 來下降患者二氫睾酮水平。做爲SRD5A2 的高效抑制劑,非那雄胺(finasteride)被普遍用於治療這類疾病。

儘管 SRD5A2 具備重要生理做用,其高分辨率結構信息卻十分缺少,致使 SRD5A2 催化二氫睾酮合成的機理以及非那雄胺抑制 SRD5A2 酶活的機制並不清晰。

這是因爲 SRD5A2 具備獨特的七次跨膜結構,其與人類所有已知結構的蛋白在結構上存在較大差別,難以經過「模板建模」(template-based modeling)方法得到初始構型來解析晶體數據。同時又由於 SRD5A2 是一類屢次跨膜蛋白,使得傳統的用於獲取蛋白質晶體相位信息的「重原子替代」(Heavy-atom derivatization)方法亦難以奏效。

爲了解決這一難題,騰訊 AI Lab 科研團隊採用了難度更高的「從頭摺疊」(de novo folding)方法來預測 SRD5A2 蛋白的三維結構,並將其用於「分子置換」(molecular replacement, MR)的初始構型來解析晶體數據。

所謂「從頭摺疊」,是相對於「模板建模」的一種蛋白質結構預測方法。「模板建模」是目前最廣泛的蛋白結構預測手段,但有一個使用前提——人類已知的蛋白結構數據庫(即PDB)當中,必須存在和預測的蛋白類似的結構,不然就沒法使用。而騰訊AI Lab採用的「從頭摺疊」方法則跳出了這個限制,能夠不依賴於模板來預測蛋白結構。

但此前,經過「從頭摺疊」方法預測的蛋白質結構精度不高,難以知足晶體數據解析的精度須要。而在騰訊 tFold 工具加持下獲得的高精度「從頭摺疊」的結構模型,爲分子置換方法提供相位,繼而解析肯定2.8Å 原子級別精度的SRD5A2晶體結構。

這一結果能直接推動咱們對體內 SRD5A2 活性失調引起的各種疾病的理解,進而爲基於 SRD5A2 結構的藥物開發提供更多有價值的參考信息。

《Nature Communications》的一位評審對此創新方法給予了高度評價:「做者能用預測的分子置換(MR)模型來肯定晶體結構,這一點很是有趣。本評審認爲該技術確實很是出色,整個X射線晶體學界將從該方法中受益不淺。」

自研冠軍級 tFold 工具突破蛋白質結構預測精度

騰訊 AI Lab 自研的 tFold 工具正是破解 SRD5A2 蛋白結構這一重要難題的關鍵。爲了提高「從頭摺疊」方法(又稱「自由建模」)的精度,tFold 工具經過三項技術創新,實現了蛋白結構預測精度的大幅提高。

首先,實驗室研發了「多數據來源融合」(multi-source fusion)技術,來挖掘多組多序列聯配(multiplesequence alignment, MSA)中的共進化信息。

而後,藉助 「深度交叉注意力殘差網絡」 (deep cross-attention residual network,DCARN),能極大提升一些重要的蛋白2D結構信息(如:殘基對距離矩陣)的預測精度。

最後,經過一種新穎的「模板輔助自由建模「(Template-based Free Modeling, TBFM)方法,將自由建模(Free Modeling, FM)和模板建模(Template-based Modeling, TBM)生成的3D模型中的結構信息加以有效融合,從而大大提升了最終3D建模的準確性。

在研究方面,tFold 平臺已在國際公認最權威的測試平臺CAMEO上證實其創新價值及有效性。騰訊 AI Lab 於2020年初在CAMEO平臺註冊了自動化蛋白結構預測服務器 tFold server,並自2020年6月起至今一直保持周度(圖1)、月度、季度、半年度冠軍。tFold server在通常案例上領先業內權威方法6%以上,在困難案例上則領先12%以上。

在應用方面,tFold server的公測版也已經在騰訊「雲深智藥」平臺發佈。用戶能夠手動輸入待預測的氨基酸序列或從本地上傳FASTA 格式的序列文件。在通過必定時間的計算以後,用戶便可獲得使用「從頭摺疊」方法預測獲得高精確度蛋白結構(下圖)。

tFold server的3D Modeling輸出頁面。左邊部分爲從頭摺疊獲得的3D蛋白模型;右邊部分是該3D模型在給定的預測殘基對距離矩陣下的誤差。

騰訊「雲深智藥」用AI持續助力藥物發現

依託大數據挖掘與機器學習等先進技術優點,騰訊正致力於推進AI與醫療產業的深度結合,助力社會總體醫療水平提高。

據瞭解,「雲深智藥」是騰訊發佈的首個AI驅動的藥物發現平臺,整合了騰訊 AI Lab和騰訊雲在前沿算法、優化數據庫以及計算資源上的優點,致力於幫助用戶大幅度減小尋找潛在活性化合物的時間和成本。

騰訊「雲深智藥」平臺主要功能

「雲深智藥」的五大模塊覆蓋臨牀前新葯發現全流程,目前各功能模塊正持續完善與升級。除蛋白質結構預測外,平臺還上線了分子生成模塊。AI驅動的分子生成模型是輔助小分子藥物設計的重要工具之一,不只能加速藥物發現流程,還能啓發藥化專家跳出現有的分子庫,探索更大的化合物空間。該模塊還整合了ADMET屬性預測功能,可對生成的新分子實時進行屬性篩選。

據介紹,平臺的逆合成算法也已取得了必定進展,計劃於明年上線。其它小分子和大分子藥物發現功能模塊也將逐步上線。

除藥物研發之外,騰訊 AI Lab 也在影像篩查、病理診斷等多個醫療領域持續探索,不斷拓展和深化研究與應用。

在AI助力醫療技術方面,實驗室聯合多家合做單位研發了中國首款智能顯微鏡,幫助醫生提升工做效率。2020年10月,在免疫組化樣本(IHC)分析的基礎上,智能顯微鏡新增了針對宮頸液基細胞(TCT)標本進行臨牀樣本的顯微圖像進行觀察、篩選、標記功能,並已得到國家藥監局審批證書。

在病理研究領域,騰訊 AI Lab 也研發出了世界領先的前沿算法,好比斬獲MICCAI 2020 CPM-RadPath 挑戰賽第一名的算法,可以準確區分神經膠質瘤(大腦最多見腫瘤)的不一樣亞型並進行分級,有望彌補人工診斷效率低、主觀因素影響較大等問題。

此外,騰訊 AI Lab 在今年早些時候與南方醫院合做發表了名爲《基於病理圖片的結直腸癌微衛星不穩定性預測模型的開發和解釋》的文章,利用算法模型可輔助病理醫生篩查結直腸癌中微衛星不穩定亞型,下降微衛星不穩定篩查的條件要求,幫助更多的地方醫院也有能力執行這樣的篩查。

更多精彩推薦
相關文章
相關標籤/搜索