基於主題模型的專利文本主題挖掘與應用研究- 專利文本主題挖掘方法

基於分類 需要認爲提前設定好一定的分類標準,並需要規定好各個主題類別信息,它是一種有監督或者半監督的方法,對於一個新文本的歸類過程也是對其文本主題信息解讀的過程。 基於聚類 無監督 通過對聚類各個類簇進行解讀,從而發現文本的主題信息。 三種流程 基於分類號 從分類角度識別專利技術主題信息 專利文本通常都有IPC分類號,該分類號對解讀文本技術主題信息具有重要作用。一個專利通常都有一個以上IPC分類號
相關文章
相關標籤/搜索