NLP11:中文分詞綜述

1.中文分詞的發展歷程 對380篇英文文獻進行分析,大多是會議論文,來源包括ACL、EMNLP、COLING、IJCNLP等,收錄最多的是ACL。SIGHAN是國際計算語言學協會中文處理特別興趣組。SIGHAN採用多家機構的評測數據組織多次評測(即BakeOff),評測使用封閉測試和開放測試兩種方法。封閉測試只允許使用固定訓練語料學習相應的模型,而開放測試可以使用任意資源。測試使用的評價標準包括準
相關文章
相關標籤/搜索