自然語言處理-錯字識別(基於Python)kenlm、pycorrector

中文文本糾錯劃分 中文文本糾錯任務,常見錯誤類型包括: 諧音字詞,如 配副眼睛-配副眼鏡 混淆音字詞,如 流浪織女-牛郎織女 字詞順序顛倒,如 伍迪艾倫-艾倫伍迪 字詞補全,如愛有天意-假如愛有天意 形似字錯誤,如 高梁-高粱 中文拼音全拼,如 xingfu-幸福 中文拼音縮寫,如 sz-深圳 語法錯誤,如想象難以-難以想象 當然,針對不同業務場景,這些問題並不一定全部存在,比如輸入法中需要處理前
相關文章
相關標籤/搜索