【原創】預訓練詞表示之word2vec(一)

本系列講解NLP任務中的詞表示(word representation)方法。 詞表示就是用連續(continuous)、稠密(dense)、低維度(low-dimension)的向量表示詞的特徵,有別於傳統nlp任務中使用的one-hot、ngram、tf-idf等特徵,詞表示是一種用連續浮點數表示的向量,具有稠密、維度低的特點,而傳統特徵太過於稀疏,且無法有效表達詞與詞之間的關係(語義相似性、
相關文章
相關標籤/搜索