BiLSTM+crf的一些理解

本篇文章假設你已有lstm和crf的基礎。 BiLSTM+softmax lstm也可以做序列標註問題。如下圖所示: 雙向lstm後接一個softmax層,輸出各個label的概率。那爲何還要加一個crf層呢? 我的理解是softmax層的輸出是相互獨立的,即雖然BiLSTM學習到了上下文的信息,但是輸出相互之間並沒有影響,它只是在每一步挑選一個最大概率值的label輸出。這樣就會導致如B-per
相關文章
相關標籤/搜索