Continuous Semantic Topic Embedding Model Using Variational Autoencoder論文閱讀

該文提出了一種連續語義主題嵌入模型(CSTEM),該模型利用主題與詞之間的連續語義距離函數來尋找文檔中潛在的主題變量。語義距離可以用歐氏空間上任何對稱的鐘形幾何距離函數來表示,本文采用馬氏距離來表示。爲了使語義距離更恰當地執行,我們新爲每個單詞引入了一個額外的模型參數,從這個距離中去掉全局因子,表明不管主題如何,它發生的可能性有多大。這無疑改善了以往的連續詞嵌入主題模型中使用的高斯分佈無法正確解釋
相關文章
相關標籤/搜索