基於維基百科構建平行語料庫

本文輔助有需求人士建立平行語料庫。 工具GitHub鏈接https://github.com/clab/wikipedia-parallel-titles 第一步:從」 https://en.wikipedia.org/wiki/List_of_ISO_639-2_codes」 上查看自己選的小語種的639-1碼 第二步:假設我要做的是阿拉伯-英語平行語料庫,阿拉伯語的639-1碼爲ar,英文的爲
相關文章
相關標籤/搜索