微軟分享史上最大基於Transformer架構的語言生成模型

導語:英偉達的「威震天」如今只能屈居第二了。網絡 微軟AI&Research今天分享了有史以來最大的基於Transformer架構的語言生成模型Turing NLG(下文簡稱爲T-NLG),並開源了一個名爲DeepSpeed的深度學習庫,以簡化對大型模型的分佈式培訓。架構 基於Transformer的架構,意味着該模型能夠生成單詞來完成開放式文本任務。除了完成未完成的句子外,它還能夠生成對輸入文檔
相關文章
相關標籤/搜索