你的 CRF 層的學習率可能不夠大

©PaperWeekly 原創 · 作者|蘇劍林 單位|追一科技 研究方向|NLP、神經網絡 CRF 是做序列標準的經典方法,它理論優雅,實際也很有效,如果還不瞭解 CRF 的讀者歡迎閱讀舊作簡明條件隨機場 CRF 介紹 | 附帶純 Keras 實現。 在 BERT 模型出來之後,也有不少工作探索了 BERT+CRF 用於序列標註任務的做法。然而,很多實驗結果顯示(比如論文 BERT Meets
相關文章
相關標籤/搜索