LASER得到句子向量,計算句子相似度

** 1 LASER 給指定文件計算句子向量 ** ./embed.sh raw.txt zh zh_embeddings.raw raw.txt:未經處理的文件 zh_embeddings.raw:句子向量 假設raw.txt是中文。raw.txt是未分詞的數據,未經tokenizer.perl處理的數據,處理過程中用jieba進行分詞,並進行bpe切分,之後再計算得到zh_embeddings
相關文章
相關標籤/搜索