漢語言處理工具pyhanlp的簡繁轉換

繁簡轉換算法

HanLP幾乎實現了全部咱們須要的繁簡轉換方式,而且已經封裝到了HanLP中,使得咱們能夠輕鬆的使用,而分詞器中已經默認支持多種繁簡格式或者混合。這裏咱們再也不作過多描述。工具

說明it

·HanLP可以識別簡繁分歧詞,好比打印機=印表機。許多簡繁轉換工具不能區分「之後」「皇后」中的兩個「後」字,HanLP能夠。io

算法詳解import

·《漢字轉拼音與簡繁轉換的Java實現》——請查閱此文程序

  1. from pyhanlp import *
  2. # 繁簡轉化
  3. print(HanLP.convertToTraditionalChinese("「之後等你當上皇后,就能買草莓慶祝了」。發現一根白頭髮"))
  4. print(HanLP.convertToSimplifiedChinese("憑藉筆記簿型電腦寫程式HanLP"))
  5. # 簡體轉檯灣繁體
  6. print(HanLP.s2tw("hankcs在臺灣寫代碼"))
  7. # 臺灣繁體轉簡體
  8. print(HanLP.tw2s("hankcs在臺灣寫程式碼"))
  9. # 簡體轉香港繁體
  10. print(HanLP.s2hk("hankcs在香港寫代碼"))
  11. # 香港繁體轉簡體
  12. print(HanLP.hk2s("hankcs在香港寫代碼"))
  13. # 香港繁體轉檯灣繁體
  14. print(HanLP.hk2tw("hankcs在臺灣寫代碼"))
  15. # 臺灣繁體轉香港繁體
  16. print(HanLP.tw2hk("hankcs在香港寫程式碼"))

17.im

18.# 香港/臺灣繁體和HanLP標準繁體的互轉di

19.print(HanLP.t2tw("hankcs在臺灣寫代碼"))co

20.print(HanLP.t2hk("hankcs在臺灣寫代碼"))nlp

21.

22.print(HanLP.tw2t("hankcs在臺灣寫程式碼"))

23.print(HanLP.hk2t("hankcs在臺灣寫代碼"))

 

 

1.「以後等你當上皇后,就能買草莓慶祝了」。發現一根白頭髮

2.憑藉筆記本電腦寫程序HanLP

3.hankcs在臺灣寫程式碼

4.hankcs在臺灣寫代碼

5.hankcs在香港寫代碼

6.hankcs在香港寫代碼

7.hankcs在臺灣寫程式碼

8.hankcs在香港寫代碼

9.hankcs在臺灣寫程式碼

10.hankcs在臺灣寫代碼

11.hankcs在臺灣寫代碼

12.hankcs在臺灣寫代碼

---------------------

做者:Font Tian

相關文章
相關標籤/搜索