wordstat中幫助文件翻譯版(一)extraction of topics部分

提取的話題 stat的主題提取特徵試圖通過自然語言處理和統計分析相結合的方法來揭示文本集合中隱藏主題結構。 WordStat中用於主題提取的主要統計過程是因子分析。從技術上講,這種抽取是通過按文檔頻率矩陣計算單詞來實現的,或者也可以通過將文檔分割成更小的塊並按段頻率矩陣計算單詞來實現的。一旦得到了這個矩陣,就需要進行可變旋轉的因子分析,以提取少量的因子所有因子加載高於特定標準的單詞將作爲提取主題的
相關文章
相關標籤/搜索