推薦系統學習筆記——十二、結巴分詞用於內容相似推薦

十二、結巴分詞用於內容相似推薦 計算物品最相似的其他物品,直接用於I2I相似推薦,或者U2I2I推薦 以文章爲例,進行內容相似推薦,一般需要以下幾個步驟: 內容獲取 一般包含ID、標題、介紹、詳情等,存儲於MySQL數據庫中。批量查取這些內容,進行下一步 中文分詞:提取關鍵詞 中文沒有空格進行分詞,所以需要手動分詞,使用TFIDF技術,jieba分詞 結巴分詞,中文分詞組件,三種模式:全模式、精確
相關文章
相關標籤/搜索