更輕量的 pQRNN:基於投影,實現快速並行的 NLP 處理

文 / Prabhu Kaliamoorthi,Google Research 軟件工程師  深度神經網絡在過去十年中從根本上改變了自然語言處理 (NLP),主要途徑是其在使用專用硬件的數據中心上的應用。然而,保護用戶隱私、消除網絡延遲、實現離線功能以及降低運營成本等需求激發了 NLP 模型在設備端而非數據中心上部署的研究的飛速發展。不過,移動設備的內存和處理能力有限,這就要求在它上面運行的模型必
相關文章
相關標籤/搜索