中文短文本聚類

文本聚類是將文檔由原有的自然語言文字信息轉化成數學信息,以高維空間點的形式展現出來,通過計算哪些點距離比較近,從而將那些點聚成一個簇,簇的中心叫做簇心。 import random import jieba import pandas as pd import numpy as np from sklearn.feature_extraction.text import TfidfTransfor
相關文章
相關標籤/搜索