語言模型

關聯規則多用於推薦系統,但是目前大部分的推薦都是推薦關聯度高的信息。 但是可以反向使用關聯規則來幫助我們找出停滯詞(無關詞) 序列模型的採樣 gram模型的缺點: 參數係數,參數空間過大,存儲和內存吃不消 沒有考慮文本中出現過多的廢話詞,可以用tf-idf優化 沒有考慮久遠之前出現的詞語對現在的影響,可以用bigram、trigram等詞袋模型解決 你知道的越多,你不知道的越多。 有道無術,術尚可
相關文章
相關標籤/搜索