機器學習平行語料庫(翻譯記憶庫)(句對齊)開源工具及方法介紹

最近一直在作平行語料庫句對齊的工做,新手上路php 根據本身查的一些資料這裏歸納一下大體的思路(這裏假設你有本身的語料庫,文章,並且是雙語的,也就是已經翻譯好的文章,而且已經作了分段,且雙語已經作了段落對齊。若是沒有的話能夠下載,一些雙語語料庫,如聯合國雙語語料庫http://opus.nlpl.eu/MultiUN.php,有了這些,你要作一個分句,接就要對齊了,以後通常是要造成一個翻譯記憶庫,
相關文章
相關標籤/搜索