76分鐘訓練BERT!谷歌深度學習的大批量優化研究被ICLR 2020接收

點擊上方「深度學習技術前沿」,選擇「星標」公衆號 資源乾貨,第一時間送達 愛也BERT,恨也BERT!BERT是史上最強的NLP模型之一,但卻也是工業界目前最耗時的應用,計算量遠高於ImageNet!谷歌的研究人員提出新的優化器,將BERT的訓練時間從3天成功縮短到76分鐘!該論文已被ICLR 2020接收。 谷歌發佈的史上最強NLP模型之一BERT,是NLP領域的一項重大突破。 隨着大規模數據集
相關文章
相關標籤/搜索