機器翻譯, 文本生成等任務評價指標 BLEU, ROUGE, PPL(困惑度)

一:BLEU      1.1  BLEU 的全稱是 Bilingual evaluation understudy,BLEU 的分數取值範圍是 0~1,分數越接近1,說明翻譯的質量越高。BLEU 主要是基於精確率(Precision)的,下面是 BLEU 的整體公式。                                    BLEU 需要計算譯文 1-gram,2-gram,...
相關文章
相關標籤/搜索