ProGen：蛋白質生成語言模型

時間 2021-01-13

原文原文鏈接

作者 | 餘梁指導 | 閔小平（廈門大學）今天給大家介紹的是一項由硅谷Salesforce Research的Ali Madani等人和斯坦福的Possu Huang教授課題組合作的工作，他們在這篇論文中提出的一種蛋白生成語言模型ProGen。作者將蛋白質工程視爲無監督序列生成問題，利用大約2.8億個的蛋白質序列對12億個參數進行訓練，且要求這些蛋白質序列是基於分類和關鍵字標籤的，如分子功能和

>>阅读原文<<