OpenGPT-2:咱們複製了 GPT-2,由於你也能夠

最近,BERT¹,XLNet²,GPT-2³和Grover 等大型語言模型在生成文本和多個 NLP 任務方面取得了使人矚目的成果。因爲 Open-AI 目前還沒有發佈其最大型號(但已發佈其 774M param 模型),他們尋求複製其 1.5B 模型,以容許其餘人在他們的預訓練模型上進行構建並進一步改進。get

咱們能夠使用他們的 Google Colab 訪問模型並生成文本,而且還單獨提供了模型權重。d3

新聞來源:medium.com語言

相關文章
相關標籤/搜索