天然語言處理工具hanlp 1.7.3版本更新內容一覽

HanLP 1.7.3 發佈了。HanLP 是由一系列模型與算法組成的 Java 工具包,目標是普及天然語言處理在生產環境中的應用。HanLP 具有功能完善、性能高效、架構清晰、語料時新、可自定義的特色。 在提供豐富功能的同時,HanLP 內部模塊堅持低耦合、模型堅持惰性加載、服務堅持靜態提供、詞典堅持明文發佈,使用很是方便,同時自帶一些語料處理工具,幫助用戶訓練本身的模型。算法

 

新版更新內容:架構

 

1.感知機詞法分析器默認使用98年人民日報6個月的大模型工具

2.優化DoubleArrayTrie fix #1136性能

3.防止ViterbiSegment.dat沒必要要的初始化優化

4.修復詞法分析器對動態插入的詞條的處理 fix #271 (comment)spa

5.詞法分析器seg接口支持自定義詞性覆蓋統計詞性 fix #1156blog

6.修訂拼音接口

7.新數據包data-for-1.7.3.zip md5=4e4f3695565a75b56427ba4a40731949ip

8.Portable版同步升級到v1.7.3md5

        <dependency>

            <groupId>com.hankcs</groupId>

            <artifactId>hanlp</artifactId>

            <version>portable-1.7.3</version>

        </dependency>

相關文章
相關標籤/搜索