中文文字校對和文檔對比合並開源工具調研

中文文字校對和文檔對比合並開源工具調研 針對中文文字錯別字校對和word,ppt等文檔對比合並需求,調研現存的一些開源工具。 一. 中文文字糾錯: pycorrector (開源 python3.6) 中文文本糾錯工具。 音似、形似錯字(或變體字)糾正,可用於中文拼音、筆畫輸入法的錯誤糾正。依據語言模型檢測錯別字位置,通過拼音音似特徵、筆畫五筆編輯距離特徵及語言模型困惑度特徵糾正錯別字。 語言模型
相關文章
相關標籤/搜索