1.提出了一種基於特徵函數和反向轉錄文法(ITG)的無監督詞對齊模型,使用對數線性
模型對文法規則的機率建模,先驗知識能夠經過特徵函數的形式加入到模型裏面,而模型仍
然能夠進行無監督訓練。
2. 在模型的參數訓練方面,本文在模型的優化目標上增長了一個L1正則化因子,使得模型
能學到一個稀疏的解,把文法規則機率集中到了對詞對齊有用的文法規則上面,提升了詞對
齊的質量。
3. 開發了一個基於ITG的無監督詞對齊軟件工具,實現了傳統的ITG無監督詞對齊模型
和基於特徵函數的ITG無監督詞對齊模型。函數
本文在詞對齊和機器翻譯兩個方面進行了相關的實驗。實驗結果代表,本文提出的模型
不管是在詞對齊仍是在機器翻譯方面都優於傳統的ITG無監督詞對齊模型。工具
全文連接:優化