LSA原理

LSA LSA和傳統向量空間模型(vector space model)一樣使用向量來表示詞(terms)和文檔(documents),並通過向量間的關係(如夾角)來判斷詞及文檔間的關係;不同的是,LSA 將詞和文檔映射到潛在語義空間,從而去除了原始向量空間中的一些「噪音」,提高了信息檢索的精確度。 文本挖掘的兩個方面應用 (1)分類: a.將詞彙表中的字詞按意思歸類(比如將各種體育運動的名稱都歸
相關文章
相關標籤/搜索