WMT 2015 FrenchEnglish parallel texts-數據集

用於訓練翻譯模型的法語/英語平行文本,擁有超過 2000 萬句法語與英語句子。本數據集由 Chris CallisonBurch 創建,他抓取了上百萬個網頁,然後通過一組簡單的啓發式算法將法語網址轉換爲英文網址,並默認這些 文檔之間互爲譯文。 This paper presents the results of the WMT09 shared tasks, which included a tr
相關文章
相關標籤/搜索