文本聚類教程

文本聚類教程 本人曾做機器學習方向,由於實習需要轉做文本聚類、分類的工作,雖然大致相似,但仍是新手,過程和結果也僅供大神指教。本博包含了作者兩週的專心研究調試及由數千行測試得到了300餘行代碼精華,如需轉載,請註明出處。 什麼是文本聚類? 文本聚類是將一個個文檔由原有的自然語言文字信息轉化成數學信息,以高維空間點的形式展現出來,通過計算那些點距離比較近來將那些點聚成一個簇,簇的中心叫做簇心。一個好
相關文章
相關標籤/搜索