NLP機器翻譯任務中,如何用Bleu score評價翻譯質量(學習心得)

機器翻譯的一大難題是,一句法語句子,可以有多種英文翻譯,這些翻譯都是非常好的 那怎麼去評估一個機器翻譯系統的質量是不是好呢? 這不像圖像識別,只有一個正確答案 通常我們有 BLEU score(Bilingual Evaluation Understudy 雙語評估替補) 來解決 在戲曲界,understudy 指的是候補演員 假設我們拿到一句法語 同時得到幾個人類翻譯的結果(都是對的,也都很準確
相關文章
相關標籤/搜索