隨筆_從《芳華》影評到TF/IDF算法

 前兩天看好多《芳華》的影評說:爲什麼好人沒好報?於是感嘆一堆世態炎涼,人性醜陋什麼的。我覺得這問題是:爲什麼中央空調(對誰都溫暖)往往不被看好。  先說說TF/IDF算法,這是一種信息處理和數據挖掘的重要算法,屬於統計類方法。比如說,找一篇文章的關鍵詞,TF(詞頻)是某個詞在這篇文章中出現的頻率,頻率越高越可能是關鍵字。IDF(逆向文件頻率)是這個詞出現在其它文章的頻率,比如「的」字,它在任何文
相關文章
相關標籤/搜索