簡單有效的多標準中文分詞詳解

簡單有效的多標準中文分詞詳解 本文介紹一種簡潔優雅的多標準中文分詞方案,可聯合多個不同標準的語料庫訓練單個模型,同時輸出多標準的分詞結果。通過不同語料庫之間的遷移學習提升模型的性能,在10個語料庫上的聯合試驗結果優於絕大部分單獨訓練的模型。模型參數和超參數全部共享,複雜度不隨語料庫種類增長。 (相關內容已經集成到大快的hanlp中,代碼和語料可訪問github上的hanlp開源項目主頁查詢) 自然
相關文章
相關標籤/搜索