#Datawhale_NLP Task5 基於深度學習的文本分類2

時間 2021-08-15

標籤 Datawhale_NLP 自然語言處理 python 機器學習欄目 Python 简体版

原文原文鏈接

文本表示方法Parts3 word2Vec模型語言模型+訓練算法自然語言處理最細的粒度是詞語，詞語是人類的抽象總結，是一種符號，對計算機而言是無法識別的。因此，要先把詞語表示成可以讓計算機識別並處理的數字或向量，這個過程叫做詞嵌入（word Embedding）方法。 word2Vec模型語言模型 CBOW：預測目標單詞 SG：預測上下文訓練算法 Hierachical Softmax N

>>阅读原文<<