使用中文wiki語料庫訓練word2vec

1. 任務描述 本文主要完成如下任務:git 訓練字的embedding(unigram char embedding) 訓練二元字的embedding(bigram char embedding) 訓練詞的embedding(word embedding) 2. 準備工做 2.1 語料準備 下載當前最新打包的中文(簡體)wiki的文本語料。 github 2.2 訓練工具 本文使用Python進
相關文章
相關標籤/搜索