BiLSTM + CRF 命名實體識別實踐(下)

0. 前言 上一篇博客簡單討論了理論知識,這篇博客主要是實踐部分,主要針對上一篇博客中提到的代碼的優化。優化點主要包含以下幾個方面: (1)max_seq_len如何取值? (2)sequence_len不固定會給模型帶來多大的提升? (3)batch_size不固定,方便預測 (4)詞向量的預訓練能給模型帶來哪些好處? (5)特定業務場景下,如何遷移? 注:數據集爲公開數據集boson.   1
相關文章
相關標籤/搜索