##關鍵詞提取技術html
TF(詞頻)-IDF(逆文檔頻率)框架
http://www.ruanyifeng.com/blog/2013/03/tf-idf.html工具
中文分詞ui
工具對比 https://my.oschina.net/apdplat/blog/412921.net
分詞方案 https://www.zhihu.com/question/19578687code
分析非結構化內容(好比文本、視頻和音頻)框架 uima視頻
淘寶的評論概括htm
https://www.zhihu.com/question/20905103blog
同義名詞和形容詞的合併文檔
可選分方法比較多,使用相關係數計算兩個詞之間的類似度,或者使用SimRank,或者使用word2vec,我採用的第一種,簡單關鍵是效果不錯。其實,形容詞的類似是有詞典能夠用的,可是直接用確定是不行的。