實體對齊之bert度量虛擬文檔的相似度

時間 2021-01-19

原文原文鏈接

基於Bert度量實體之間的相似度基本思想：將實體的對齊問題轉換成文本之間的相似度度量問題準備工作：Bert的預訓練模型（google提供了中文的預訓練模型），實體相似度的標記文本 A． Bert的預訓練模型模型的輸入（每個單詞有三個embedding，把單詞對應的三個embedding疊加）（1）token embeddings表示的是詞向量，第一個單詞是CLS，可以用於之後的分類任務（

>>阅读原文<<