Python實現根據評論評分信息預測 (協同過濾,LFM,詞向量)

  一.數據集 train.dat共393366項,第一維是用戶的代號,第二維是商品代號,第三項是用戶對該商品的評分,第四項是評論數,第五項是評論內容。   test.dat第一維是用戶代號,第二維是商品代號。   二.簡單思路及實現過程 這裏簡單先貼出代碼實現,後期再慢慢補上具體過程說明~ 1.數據預處理 去除部分無關常用詞,這裏調用nltk包,將評論詞詞詞根化等,進行評論數據的預處理,存爲ne
相關文章
相關標籤/搜索