自然語言處理——語義向量

將文本的符號表示轉換爲語義空間中的向量表示是現在量化比較語義的通用做法,這類方法通常都基於Harris的分佈式假設,即在相似上下文中的詞通常都有着相似的語義. 下面首先會對已有的一些文本語義表示模型進行介紹. 表示形式 Term-Document Matrix 這種是最原始的一種語義衡量方法,主要用於文檔檢索,比較不同文檔間的語義,其核心就是Term-Document Matrix,如下圖所示,可
相關文章
相關標籤/搜索