The Evolved Transformer 學習筆記

摘要 通過neural architecture search的方法提升普通transformer, 速度比普通transformer提升兩倍, 效果在機器翻譯比普通transformer提升0.7 BLEU neural architecture search 設計出一些可能的神經網絡結構,分別在測試集上評估效果 Search Space 本文搜索空間包括兩個stackable cell,一個在
相關文章
相關標籤/搜索