TF-IDF及相關知識(餘弦相似性)

自然語言的處理是一個神奇的領域,它涉及到數據挖掘、文本處理、信息檢索等很多計算機前沿領域,由於複習相關知識,所以這裏對該方向的部分知識做一個簡單的介紹和記錄。 該文主要記錄的是一個很簡單卻很經典有效的算法——TF-IDF。從它的概念到運算可能花不了10分鐘就能瞭解,並且用到的運算知識都不涉及高等數學,但往往能返回我們一個滿意的答案。 當我們輸入一段檢索信息時,可以利用TF-IDF算法,給我們返回一
相關文章
相關標籤/搜索