運行 Moses 期間遇到的問題

一. 處理原始語料,我用的語料是http://mitel.ict.ac.cn/mteval/data/train.xml.gz中的30萬句對python 1. 用python裏面的ElementTree 將XML文件解析出來並分紅ch和en兩個文件(注意,該語料自己是有問題的,有些標記沒有匹配,須要先用正則進行修改。另外,須要先用notepad 將語料轉換成utf-8,並在XML文件的第一行寫上<
相關文章
相關標籤/搜索