深藍詞庫轉換2.4版發佈,支持最新的搜狗用戶詞庫備份bin格式

很高興的告訴你們,感謝GitHub上的h4x3rotab提供python版的搜狗用戶詞庫備份bin格式的解析算法,感謝tmxkn1提供了C#版的實現,深藍詞庫轉換終於迎來了一個重大更新,可以支持搜狗用戶詞庫的bin格式備份的導出了。不再用受到搜狗輸入法的鉗制,能夠自由切換到其餘輸入法了。搜狗bin詞庫只解析到了用戶詞條和詞頻,沒有拼音,因此若是要導出其餘拼音輸入法,中間轉換工具會根據詞條的內容從新生成拼音。python

image

另外在2.4版中,增長了用戶詞頻強制設置的功能,好比將搜狗用戶詞庫bin格式備份轉換爲Win10自帶的微軟拼音,那麼詞頻會致使該詞條在微軟拼音上的位置不對,那麼咱們就須要忽略掉搜狗bin格式解析出來詞頻,而是使用1表示詞頻,這樣在微軟拼音中才會顯示正常。git

image

設置了強制的默認詞頻後,全部詞頻將按照新詞頻算法生成。github

image

導入到Win10自帶微軟拼音的用戶自定義短語後的效果如圖:算法

image

最新版的深藍詞庫轉換的下載地址:工具

https://github.com/studyzy/imewlconverter/releases3d

 

最後,再聲討一下一個叫「 奧創詞庫轉換」的,把個人深藍詞庫轉換代碼拿來改一下界面,就變成了本身的軟件,極度無恥和噁心。深藍詞庫轉換一直是免費綠色開源的,可是也看不慣這種無底線的剽竊行爲,強烈譴責一下。blog

相關文章
相關標籤/搜索