LaBSE: 支持 109 種語言的多語言 BERT 嵌入向量模型

文 / 軟件工程師 Yinfei Yang 和 Fangxiaoyu Feng,Google Research 多語言嵌入向量模型是一種功能強大的工具,可以將不同語言的文本編碼到共享的嵌入向量空間,可應用於下游一系列任務,例如文本分類、聚類等,同時還能夠利用語義信息理解語言。現有生成此類嵌入向量的方法(如 LASER 或 m~USE)依賴於並行數據,將句子從一種語言直接映射到另一種語言,促進句子嵌
相關文章
相關標籤/搜索