ProGen:蛋白質生成語言模型

作者 | 餘梁 指導 | 閔小平(廈門大學) 今天給大家介紹的是一項由硅谷Salesforce Research的Ali Madani等人和斯坦福的Possu Huang教授課題組合作的工作,他們在這篇論文中提出的一種蛋白生成語言模型ProGen。作者將蛋白質工程視爲無監督序列生成問題,利用大約2.8億個的蛋白質序列對12億個參數進行訓練,且要求這些蛋白質序列是基於分類和關鍵字標籤的,如分子功能和
相關文章
相關標籤/搜索