利用word2vec對關鍵詞進行聚類

繼上次提取關鍵詞以後,項目組長又要求我對關鍵詞進行聚類。說實話,我不太明白對關鍵詞聚類跟新聞推薦有什麼聯繫,不過他說什麼我照作就是了。php 按照通常的思路,能夠用新聞ID向量來表示某個關鍵詞,這就像廣告推薦系統裏面用用戶訪問類別向量來表示用戶同樣,而後就能夠用kmeans的方法進行聚類了。不過對於新聞來講存在一個問題,那就量太大,若是給你十萬篇新聞,那每個關鍵詞將須要十萬維的向量表示,隨着新聞數
相關文章
相關標籤/搜索