實體對齊之bert度量虛擬文檔的相似度

基於Bert度量實體之間的相似度 基本思想:將實體的對齊問題轉換成文本之間的相似度度量問題 準備工作:Bert的預訓練模型(google提供了中文的預訓練模型),實體相似度的標記文本 A. Bert的預訓練模型 模型的輸入(每個單詞有三個embedding,把單詞對應的三個embedding疊加) (1)token embeddings表示的是詞向量,第一個單詞是CLS,可以用於之後的分類任務 (
相關文章
相關標籤/搜索